TrafficVeil
Вернуться к документации
Документация

ML Bot Detection

Как работает машинное обучение для обнаружения ботов с точностью 99.7%.

99.7% точность
30+ сигналов

Сигналы для анализа

СигналОписаниеТип
User-Agent анализПроверка строки User-Agent на аномалии и известные ботыБазовый
TLS Fingerprint (JA3)Уникальный отпечаток TLS рукопожатия клиентаПродвинутый
HTTP/2 FingerprintАнализ параметров HTTP/2 соединенияПродвинутый
JavaScript ChallengeПроверка выполнения JavaScript в браузереБазовый
Cookie SupportПроверка поддержки и сохранения cookiesБазовый
Canvas FingerprintУникальный отпечаток рендеринга CanvasПродвинутый
WebGL FingerprintОтпечаток графического адаптераПродвинутый
Timezone & LanguageСоответствие часового пояса и языка IPБазовый
Mouse MovementАнализ движений мыши (человек vs бот)Поведенческий
Scroll BehaviorПаттерны прокрутки страницыПоведенческий
Click PatternsАнализ паттернов кликовПоведенческий
Request TimingАнализ времени между запросамиПоведенческий
Session ConsistencyКонсистентность данных в рамках сессииПродвинутый
IP ReputationРепутация IP адреса в глобальных базахБазовый
ASN AnalysisАнализ автономной системы (datacenter, residential)Базовый

Как работает ML Bot Detection


Машинное обучение в действии

TrafficVeil использует нейросеть, обученную на миллиардах запросов, для определения ботов с точностью 99.7%.


Процесс анализа:

1. Запрос поступает на наш сервер

2. Собираем 30+ сигналов о посетителе

3. Нейросеть анализирует паттерны

4. Выдаёт оценку: 0-100 (0 = точно бот, 100 = точно человек)

5. Решение: пропустить, проверить или заблокировать


Типы определяемых ботов:

  • Скрейперы и парсеры
  • SEO боты (Ahrefs, Semrush, Majestic)
  • Сканеры уязвимостей
  • Спам-боты
  • Headless браузеры (Puppeteer, Playwright, Selenium)
  • HTTP библиотеки (Python requests, curl, wget)
  • Автоматизированные атаки

  • Разрешённые боты:

  • Googlebot, Bingbot, Yandexbot
  • Социальные сети (Facebook, Twitter, LinkedIn)
  • Мониторинг (UptimeRobot, Pingdom)
  • Другие легитимные боты

  • Настройка чувствительности


    Уровни чувствительности:


    Низкий (Low)

  • Порог: 20
  • Блокирует только явных ботов
  • Минимум ложных срабатываний
  • Рекомендуется для новых сайтов

  • Средний (Medium) — рекомендуется

  • Порог: 40
  • Баланс между защитой и UX
  • Подходит для большинства сайтов
  • Может требовать капчу для подозрительных

  • Высокий (High)

  • Порог: 60
  • Агрессивная защита
  • Больше проверок для подозрительных
  • Для сайтов под атакой

  • Параноидальный (Paranoid)

  • Порог: 80
  • Максимальная защита
  • Много проверок и капч
  • Только при серьёзных атаках

  • Настройка:

    1. Откройте настройки домена

    2. Перейдите в раздел "Bot Detection"

    3. Выберите уровень чувствительности

    4. Сохраните изменения


    Ложные срабатывания


    Что такое ложное срабатывание?

    Когда легитимный пользователь ошибочно определяется как бот.


    Причины ложных срабатываний:

  • VPN или корпоративный прокси
  • Устаревший браузер
  • Отключённый JavaScript
  • Нестандартные настройки браузера
  • Мобильные приложения
  • API клиенты

  • Как минимизировать:

    1. Начните с низкого уровня чувствительности

    2. Добавьте известные IP в Whitelist

    3. Настройте исключения для API endpoints

    4. Мониторьте логи на предмет ложных срабатываний


    Что делать, если заблокирован легитимный пользователь:

    1. Найдите IP в логах

    2. Проверьте причину блокировки

    3. Добавьте в Whitelist при необходимости

    4. Скорректируйте чувствительность


    Исключения для API:

    Если у вас есть API, добавьте endpoints в исключения:

  • /api/*
  • /webhook/*
  • /callback/*