
Главное
• AI-детекция аномалий в видеонаблюдении учится определять «норму» по видео и в реальном времени помечает всё, что в неё не вписывается — праздношатание, падения, оставленные сумки, проникновение, драки.
• Узкое место — ложные срабатывания, а не сама детекция. Модель с точностью 95%, выдающая 20 ложных тревог в час, будет отключена операторами уже на второй неделе. Сначала проектируйте precision и рабочий процесс оператора, потом всё остальное.
• Edge + cloud — доминирующий стек 2026 года. Лёгкая детекция работает прямо на камере или NVR (NVIDIA Jetson / Hailo / Coral), а сложные случаи эскалируются в облачную модель только при пограничной уверенности.
• Комплаенс — не опциональная история. GDPR, BIPA, EU AI Act, аппаратные запреты NDAA и отраслевые правила (HIPAA в здравоохранении, PCI в ритейле) определяют, что и где вы вправе разворачивать.
• Кастомная разработка выигрывает у коробочных решений, когда у вас специфическая сцена (производственный цех, зал суда, стадион, больница) и операторы, готовые реагировать на тревоги. Плагины к коробочным VMS подходят только для типового детектирования проникновений.
По теме: читайте наш полный гайд — Топ-7 моделей детекции аномалий для видеонаблюдения (2026).
Зачем Фора Софт написала этот плейбук
Фора Софт создаёт продукты в области видео и видеонаблюдения с 2005 года — кастомные VMS-платформы, системы записи в залах судов и AI-стеки для ритейл-безопасности. Наша практика покрывает весь конвейер: захват с камер, инференс на edge, агрегацию в облаке, рабочий процесс оператора и аудит-трейл — а не только саму модель.
Эту статью мы используем как чек-лист, по которому проходим со стартапами, руководителями служб безопасности и продакт-оунерами на скоупинг-созвонах. Основа — наши же материалы из этого блога (разбор edge AI vs cloud AI и гайд по кастомным VMS) и продакшен-метрики из реальных внедрений.
На каждом проекте мы применяем Agent Engineering — поэтому сроки скоупинга и интеграции у нас короче, чем у классических команд. Все ценовые диапазоны ниже — это реальная вилка Фора Софт, а не средняя по рынку.
Нужна детекция аномалий, у которой меньше пяти ложных тревог в день?
Мы проектируем модель, edge-стек и рабочий процесс оператора. Большинство пилотов выходит в прод за 8 недель.
Что такое AI-детекция аномалий на самом деле
Детекция аномалий — это класс задач компьютерного зрения, где модель учится распределению нормального поведения в сцене: типичным векторам движения, времени пребывания, заполняемости, траекториям объектов — и помечает любой кадр, сегмент или траекторию, выпадающие из этого распределения. В отличие от детекции объектов («есть ли тут человек?») или распознавания действий («бежит ли этот человек?»), детекция аномалий отвечает на вопрос «необычно ли это для данной сцены в данное время?»
Большинство продакшен-систем объединяют три слоя: быстрый детектор объектов (YOLOv8/YOLOv11, RT-DETR), темпоральную модель, которая трекает объекты между кадрами (ByteTrack, BoT-SORT), и аномальную «голову», которая сравнивает наблюдаемое поведение либо с обученной моделью нормальности (автоэнкодер, one-class SVM, normalising flow), либо с правилами (вторжение в зону, пороги праздношатания, таймеры оставленных предметов). Именно гибрид даёт промышленную точность.
Почему это важно в 2026 году
Три фактора в этом году сделали AI-детекцию аномалий обязательной в видеонаблюдении. Во-первых, парки камер огромны: типичное корпоративное развёртывание сегодня превышает 200 каналов, и ни один оператор-человек физически не способен такое мониторить. Во-вторых, edge-ускорители (NVIDIA Jetson Orin Nano, Hailo-15, Google Coral) подешевели до 22 500–52 500 ₽ за устройство, и инференс прямо на камере наконец стал доступным. В-третьих, EU AI Act и новые законы штатов США (Illinois BIPA, California CPRA) требуют аудируемой и объяснимой аналитики — а коробочные облачные системы часто не могут её обеспечить.
Сценарии, которые реально окупаются
| Отрасль | Аномалия для детекции | Типовой драйвер ROI |
|---|---|---|
| Ритейл | Кражи в торговом зале, sweethearting, длина очереди, падения покупателей | Снижение потерь (целевой уровень 0,3–1,0% от продаж) |
| Здравоохранение | Падения пациентов, уход в нежелательные зоны, вход в запретные зоны | Сокращение времени реакции, скидки страховщика |
| Производство | Нарушения СИЗ, заклинивание конвейера, near-miss по охране труда | Снижение OSHA-рисков, стоимость простоев |
| Транспорт / аэропорты | Оставленные сумки, движение против потока, плотность толпы | Ускорение эвакуации, соответствие требованиям регулятора |
| Стадионы и мероприятия | Опасные скопления, драки, проникновение в закрытые зоны | Скоринг безопасности события, страховые премии |
| Логистика и склады | Опасные ситуации с погрузчиками, кражи, несоответствие дока заявке | Предотвращение потерь, аудит-трейл для претензий |
| Критическая инфраструктура | Проникновение через периметр, дроны, аномальное движение транспорта | Требования регулятора, скидки страховщика |
Подробнее о реализованных нами паттернах AI в ритейле смотрите в нашем материале о разработке облачной видеоплатформы для AI-системы безопасности в ритейле.
Референсная архитектура — четыре слоя, которые работают в проде
Продакшен-стек детекции аномалий, который мы разворачиваем, почти всегда разбивается на четыре слоя с явными контрактами между ними — чтобы каждый можно было заменить или обновить независимо.
1. Захват и транспорт. ONVIF/RTSP-совместимые камеры (4–8 МП), кодирование H.264 / H.265, стриминг по приватной VLAN. NDAA-совместимое железо (без прошивок Hikvision / Dahua) обязательно для контрактов с федеральными ведомствами США.
2. Edge-инференс. Небольшой бокс на каждые 8–16 камер с детектором объектов, трекером и лёгкой аномальной «головой». NVIDIA Jetson Orin Nano (~22 500 ₽, 40 TOPS), Hailo-15 (~15 000 ₽, 20 TOPS) или серверный Jetson AGX Orin (~112 500 ₽, 275 TOPS) для плотных объектов. ONVIF-события стреляют только по подтверждённой аномалии.
3. Облачная агрегация и модель второго прохода. Когда уверенность edge-модели пограничная, 5–10-секундный клип отправляется в облачную модель (более тяжёлый видео-трансформер, мультикамерное рассуждение) для подтверждения — и только потом срабатывает тревога. Хранилище обычно S3-совместимое, retention 30–90 дней.
4. Консоль оператора и аудит-трейл. Веб-приложение для триажа, мобильные пуши для дежурных, MQTT/вебхуки для интеграции с VMS / SIEM, неизменяемый журнал событий для комплаенса. Именно рабочий процесс оператора определяет, экономит ли система деньги — или просто пылится.
Берите edge-first, когда: у вас сотни камер, жёсткие бюджеты по задержке (менее 300 мс) или дорогой исходящий трафик — математика edge vs cloud, как правило, склоняется в пользу edge при 50+ каналах.
Алгоритмы, которые стоят за этой «магией»
Единого алгоритма для детекции аномалий не существует — продакшен-системы комбинируют сразу несколько, у каждого своя сильная сторона.
1. Детекторы объектов. YOLOv8 / YOLOv11, RT-DETR, EfficientDet. На выходе — bounding box и класс. Это фундамент для всего остального.
2. Трекеры. ByteTrack, BoT-SORT, OC-SORT. Превращают покадровые детекции в траектории, чтобы «человек слоняется» можно было выразить как «траектория id N находилась в радиусе 5 м от точки X более 3 минут».
3. Распознавание действий. SlowFast, X3D, VideoMAE-v2 — для «это падение?», «это драка?», «это бросок?». Десять лет назад здесь требовались вручную сконструированные признаки; сегодня дообученный VideoMAE-v2 даёт 90%+ на подмножествах Kinetics-400.
4. Аномальные «головы». Автоэнкодеры (ошибка реконструкции как аномальный скор), one-class SVM, Isolation Forest, normalising flows (FastFlow, CFLOW). Для аномалий по внешнему виду (поломка оборудования, несанкционированный доступ).
5. Правила. Контринтуитивно, но простые правила (зона, время пребывания, счётчик, пересечение линии) ловят 60–70% полезных событий почти без вычислительных затрат. Поставляются в проде всегда — вместе с ML-моделями.
Подробнее — в нашем сопутствующем материале об алгоритмах машинного обучения для детекции аномалий.
Build, buy или гибрид — сравнительная матрица
| Измерение | Плагин к коробочному VMS | Облачный AI-сервис (Verkada, Avigilon, Spot AI) | Кастомная разработка |
|---|---|---|---|
| Время до первой детекции | Дни | Недели | 8–14 недель |
| Тюнинг под вашу сцену | Ограничен | Ограничен | Полный |
| Стоимость на камеру / месяц | 150–750 ₽ | 2 250–6 000 ₽ | 225–1 125 ₽ (после разработки) |
| Edge-инференс | Иногда | Привязка к вендорскому железу | Да — любой ускоритель |
| Контроль над хранением данных | Ограничен | У вендора | Полный |
| Аудит-трейл / EU AI Act | Частично | На усмотрение вендора | Спроектирован под требования |
| Интеграция с вашей VMS / SIEM | Нативная (одна VMS) | Только их VMS | Любая — через webhooks / MQTT / ONVIF |
| Для чего лучше всего | Типовая защита от проникновений, один объект | Средний бизнес, много площадок, слабая ИТ-команда | Доменные задачи, регулируемые отрасли, мультисистемные среды |
Пример расчёта: 100 камер, розничная сеть
Ниже — модель, которую мы используем на скоупинге. Представьте розничную сеть из пяти магазинов и 100 камер, задача — ловить кражи, падения покупателей, длину очереди и проникновения вне часов работы.
| Статья | Количество | Ориентировочная стоимость |
|---|---|---|
| Edge-боксы (Jetson Orin Nano, 1 на ~10 камер) | 10 | ~262 500 ₽ capex |
| Облачный второй проход и хранилище / месяц | 100 каналов × 30 дней | ~30–67 тыс. ₽/мес |
| Кастомная разработка (8–12 недель, компактная команда) | 1 | 4,5–10,5 млн ₽ |
| Консоль оператора и роутинг тревог | 1 | Включено в разработку |
| Годовой run-rate после запуска | 100 каналов | ~375–825 тыс. ₽/год эксплуатация + ~225–1 125 ₽/камеру/мес |
Для сравнения: облачная подписка уровня Verkada на тот же парк обходится в 3 000–6 000 ₽ на камеру в месяц, или 3,6–7,2 млн ₽ в год. Кастомная разработка окупается за 18–24 месяца при парке более 50 камер — быстрее, если вам нужны хранение данных в своей юрисдикции или специфические события, которые коробочный SaaS просто не умеет генерировать.
Проблема ложных срабатываний — как удержать менее пяти в день
Модель с 95% true-positive rate бесполезна, если она стреляет 50 раз в час. Главный фактор того, выживет ли детекция аномалий в проде, — частота ложных срабатываний. Четыре рычага, которые мы используем на каждом проекте:
- Покамерная калибровка. Обученная базовая линия для каждой камеры и каждого времени суток — чтобы «человек в 3 часа ночи» значил разное в круглосуточной больнице и в офисе.
- Двухступенчатый каскад. Edge-модель с precision ~70% триггерит облачную модель второго прохода с precision ~95%. Операторы видят только подтверждённые тревоги.
- Обратная связь от операторов. Каждое отмеченное оператором ложное срабатывание становится размеченным негативным примером для следующего цикла обучения. Модель учит конкретный объект.
- Правила подавления. Захардкоженные зоны-исключения (маршрут клининга, разгрузочный док в 5–7 утра, известная смена обслуживания). Скучно — и предельно эффективно.
Сделанное правильно, это даёт корпоративным объектам менее 5 ложных тревог в день на 100 камер — то есть ниже порога, при котором операторы перестают мьютить алерты.
Операторы выгорают на ложных тревогах?
Мы посмотрим ваш текущий стек детекции и предложим изменения по калибровке, каскаду и правилам подавления, которые снижают ложные срабатывания на 80–90%.
Сбор данных, разметка и обучение модели
1. Захват. Две недели записей с каждой камеры, охватывающие все смены. Десяти часов мало; 200 часов уже хватает.
2. Предобработка. Семплирование кадров (1–5 fps для статичных сцен, 10+ fps для падений и драк), вычитание фона при стабильном освещении, маскирование приватных зон (детские, санузлы).
3. Разметка. Активное обучение с небольшим экспертным пулом. Инструменты, которыми мы пользуемся: Label Studio, CVAT, Roboflow. Закладывайте 50–100 часов разметки на каждый класс аномалии для стартового датасета.
4. Обучение. Дообучение моделей с открытыми весами (YOLOv11, VideoMAE-v2) быстрее, дешевле и интерпретируемее, чем обучение с нуля. Few-shot-подходы к аномалиям (PatchCore, FastFlow) хорошо работают, когда размеченных аномальных примеров мало.
5. Непрерывное обучение. События, отмеченные операторами, попадают в еженедельный цикл переобучения. Проверка на дрифт на каждом релизе: если precision на отложенной выборке падает более чем на 5 пунктов, деплой блокируется.
Edge vs cloud — задержка, стоимость и почему гибрид по умолчанию
Edge-инференс снижает задержку с секунд до менее чем 200 мс, устраняет почти весь исходящий трафик и оставляет сырое видео на площадке. Облачный инференс позволяет крутить модели, которые не помещаются на edge-железе, делать мультикамерные рассуждения и принимать на себя тяжёлое переобучение. Дефолт 2026 года — гибрид: edge делает первый проход по каждому кадру, облако подтверждает и выполняет исторический поиск.
Несколько эмпирических правил из наших внедрений:
- < 50 камер, регулируемая отрасль: гибрид с NDAA-совместимыми камерами, on-prem-серверы, опционально только облачный аудит-журнал.
- 50–500 камер: edge-боксы на ~10–16 камер, облачный второй проход и хранилище. Лучшее соотношение цена/производительность.
- 500+ камер: серверные edge-стойки на каждой площадке (Jetson AGX Orin, GPU A2/A30), региональная облачная агрегация. Закладывайте круглосуточное SRE-дежурство.
Безопасность, приватность и комплаенс — фильтр deal-breaker
1. EU AI Act. Биометрическая идентификация в реальном времени в общественных местах в основном запрещена; небиометрическая детекция аномалий (праздношатание, проникновение, падения) остаётся разрешённой, но во многих сценариях относится к категории высокого риска — а значит, обязательны аудит-логи, человеческий надзор и оценка соответствия.
2. GDPR и UK GDPR. Нужно законное основание (тест на легитимный интерес, DPIA), сроки хранения и права субъекта данных. Самая простая мера — приватное маскирование лиц в записях из общественных зон.
3. NDAA Section 889. Федеральные проекты США не могут использовать камеры Hikvision / Dahua / Huawei и их основные компоненты. Подходящие альтернативы — Axis, Hanwha, Bosch, i-PRO, Pelco.
4. BIPA и законы штатов. Illinois, Texas, Washington и растущий список штатов регулируют сбор биометрии. Детекция аномалий без извлечения биометрических признаков обычно вне регулирования — но дополнения с распознаванием лиц уже нет.
5. Отраслевые рамки. HIPAA в здравоохранении, PCI в офлайн-ритейле, NERC CIP в энергетике, CJIS в правоохранительной сфере. Каждая добавляет явные требования поверх базовых.
Мини-кейс: зал суда и розничная сеть — один стек, две сцены
Ситуация. В одном квартале к нам пришли клиент с системой записи судебных заседаний и региональная розничная сеть, обоим нужна была AI-видеоаналитика. Суду требовалось детектировать вход в чужой зал и предупреждения об оставленных вещественных доказательствах, ритейлу — кражи и падения покупателей. Оба настаивали на хранении данных в своей юрисдикции и обработке on-prem.
План на 12 недель. Один и тот же бекбон — YOLOv11 + ByteTrack + автоэнкодерная аномальная «голова» — с двумя сценоспецифичными головами, дообученными на 200 часах записей. Edge-боксы по зонам (Jetson Orin Nano), приватная VLAN, on-prem-консоль оператора. Аудит-журнал в WORM-хранилище для обоих клиентов.
Результат. Объект суда: частота ложных тревог < 2 в день на 30 камерах; среднее время реакции оператора на отмеченные события упало с ~95 секунд до ~22. Ритейл: кражи помечались с полнотой ~88% на внутренней оценке; время реакции на падение покупателя — с ~7 минут до ~90 секунд. Один и тот же инженерный вклад — два разных продукта.
Хотите такую же оценку?
Фреймворк решения — выберите путь за пять вопросов
В1. Насколько специфична ваша сцена? Типовое проникновение или движение — хватит плагина к коробочной VMS. Доменная задача (производство, зал суда, больница, спорт) — кастом или гибрид.
В2. Сколько камер? Меньше 30 — облачный SaaS подойдёт. 30–500 — побеждает гибрид по стоимости. 500+ — собственный edge-парк.
В3. Вы под EU AI Act, NDAA, BIPA или отраслевым комплаенсом? Да — смещайтесь в сторону кастомной разработки с явным аудит-трейлом.
В4. Будут ли операторы реально реагировать на тревоги? Если нет — сначала чините процесс. Никакая модель не починит сломанный процесс реагирования.
В5. Какие требования по локализации данных? Только-облако подходит для нерегулируемых сценариев; иначе ставьте инференс on-prem и отправляйте наружу только агрегированные метаданные.
Пять ловушек, которые мы видим каждый квартал
1. Выбор модели до выбора процесса. Готовность операторов реагировать — это ограничивающий фактор. Сначала проектируйте схему диспетчеризации, затем подбирайте модель под порог precision.
2. Игнорирование качества камер. Камера 4K с плохим битрейтом хуже, чем 2 МП с высоким битрейтом. Проверяйте кодировщик до обучения.
3. Недооценка стоимости разметки. Большинство проектов недофинансируют разметку в 3–5 раз. Закладывайте бюджет.
4. Пропуск консоли оператора. Отличная модель с плохим UI триажа провалится. Относитесь к консоли как к продукту первого класса.
5. Комплаенс как «бумажки». Аудит-логи EU AI Act и уведомления BIPA блокируют запуск, если их обнаруживают поздно. Закладывайте их с первого дня.
KPI, которые стоит отслеживать после запуска
1. KPI качества. Precision (цель > 90%), полнота (> 80% для событий безопасности), частота ложных срабатываний на 100 камер (цель < 5/день).
2. KPI эксплуатации. Среднее время до реакции оператора (цель < 60 с для высокого приоритета), доля заглушённых тревог (< 5%), время от инцидента до закрытия по сравнению с базовой линией.
3. KPI надёжности. Время доступности на камеру (> 99,5%), задержка edge-инференса P95 (< 250 мс), полнота аудит-журнала (100%).
Когда AI-детекцию аномалий разворачивать ещё рано
Три сценария, в которых правильный ответ — «пока нет». Первый: у вас нет команды операторов и процесса эскалации — вы получите тревоги, на которые никто не отреагирует. Второй: ваш парк камер настолько слабый (< 1 МП, низкий битрейт, нестабильное питание), что вы будете учить модель на шуме. Сначала разберитесь с камерами. Третий: регулирование AI в вашей юрисдикции и отрасли ещё в стадии становления — пилотируйте в нерегулируемом сегменте, пока юридическая картина не прояснится.
Нужен 30-минутный архитектурный разбор вашей системы видеонаблюдения?
Расскажите о количестве камер, сценах и комплаенс-ограничениях — мы вернёмся с рекомендацией build vs buy и письменной вилкой бюджета.
FAQ
Насколько точна AI-детекция аномалий в 2026 году?
Для чётко определённых аномалий (праздношатание, проникновение, оставленный предмет) на откалиброванных сценах достижима precision > 95%. Для тонких сценариев (кражи в торговом зале, драки, падения) продакшен-системы обычно работают с precision 85–92% и полнотой 75–88% после 4–8 недель переобучения по обратной связи операторов.
Нужны ли новые камеры для запуска AI-детекции?
Обычно нет — если ваши камеры от 2 МП по ONVIF/RTSP со стабильным битрейтом. Мы можем гонять инференс прямо по потоку. Замену рекомендуем только тогда, когда камеры не дают разрешения или fps, необходимых модели.
Может ли система детектировать то, что не было размечено?
Да — это и есть «настоящий» режим детекции аномалий. Модель нормальности (автоэнкодер, normalising flow) помечает отклонения даже без меток конкретного события. Precision ниже, чем у обучения с учителем, поэтому мы обычно комбинируем оба подхода.
Как это уживается с GDPR и BIPA?
Для небиометрической детекции аномалий мы разворачиваем инференс on-prem, размываем лица и номерные знаки в сохранённых записях, ставим короткие сроки хранения и фиксируем законное основание (DPIA для GDPR, процесс письменного согласия для BIPA там, где применимо). Аудит-журнал — это доказательство соблюдения.
Сколько стоит пилот на 8–12 недель?
Для типового объёма 30–100 камер мы запускаем пилоты в диапазоне 3–9 млн ₽ — включая обучение модели, развёртывание edge, MVP консоли оператора и настройку аудит-журнала. Финальная сумма зависит от сложности сцен и объёма комплаенс-работ — фиксированную цену без скоупинга мы не даём.
Будет ли это работать в темноте или на улице?
Да, с оговорками. Камеры с ИК- или тепловизионными сенсорами сохраняют точность до сумерек; чисто цветные модели резко проседают ниже ~3 люкс. Для уличных сцен мы добавляем тренировочные данные с погодными аугментациями и модели под разные условия.
Интегрируется ли это с нашей существующей VMS?
Да. Мы обычно отправляем события как ONVIF Profile T-метаданные, MQTT-сообщения или вебхуки в Milestone XProtect, Genetec Security Center, Avigilon ACC, Frigate или любую кастомную VMS. Консоль опциональна, если у вас уже есть UI триажа.
Можно ли реализовать решение без Hikvision и Dahua?
Да — мы регулярно поставляем NDAA-совместимые внедрения на камерах Axis, Hanwha, Bosch, i-PRO и Pelco с edge-ускорителями NVIDIA Jetson или Hailo. Все наши референсные дизайны по умолчанию NDAA-совместимы.
Что почитать дальше
Edge vs Cloud
Edge AI vs Cloud AI для видеонаблюдения
Разбор задержек и стоимости в 2026 году по реальным внедрениям.
Кастомная VMS
Гайд по разработке кастомной VMS
Как построить Video Management System под ваши сцены.
Безопасность ритейла
Облачная видеоплатформа для AI-безопасности ритейла
Архитектура 2026 года для кражеконтроля и аналитики очередей.
Видеораспознавание
Разработка ПО для видеораспознавания
Создание кастомного видеораспознавания для современных приложений.
Готовы запустить детекцию аномалий, которой будут доверять операторы?
AI-детекция аномалий в 2026 году — зрелая, доступная и регулируемая технология. Узким местом перестала быть точность; теперь это «пол» по ложным срабатываниям, рабочий процесс оператора и аудит-трейл. Берите кастом, когда сцены специфичны и операторы готовы действовать; берите гибрид edge + cloud, когда парк больше 30 камер; и закладывайте комплаенс в проектирование с первого дня.
Если вам нужен партнёр, который уже поставил это в проде на регулируемых, on-prem, мультиплощадочных внедрениях — от записи в залах судов до ритейла и производства, — поговорите с нами. За 30 минут мы скажем, что вам подходит лучше — build или buy, — и обоснуем рекомендацию теми же цифрами, что и выше.
Детекция аномалий, которая окупается за 18 месяцев
30 минут, ваш парк камер, честный план. Покажем математику build vs buy и план работ на ближайшие 8 недель.

