Обнаружение аномалий в видеонаблюдении: практическое руководство по VMS на 2026 год

Детекция аномалий в видеонаблюдении: инженерное руководство по VMS на 2026 год — обложка

Ключевые тезисы

• Детекция аномалий — это про поведение, а не про объекты. Болтание без цели, падения, драки, оставленные предметы, давка в толпе — ценность в том, чтобы поймать то, что происходит не так, как должно, а не просто пересчитать всё, что видно на кадре. Распознавание лиц анализатором аномалий не является.

• В реальной эксплуатации точность на 10–20 пунктов ниже бенчмарков. SOTA на UCF-Crime в статьях даёт 85–92 % AUC. Ваши камеры в 16:00 в июне покажут 70–82 %. Закладывайте этот разрыв в план и калибруйте на месте.

• Ложные срабатывания убивают доверие оператора за первую неделю. Если алертов больше трёх на камеру в день — операторы отключают канал, и продукт становится бесполезным. С самого начала настраивайте пороги по зонам, фильтруйте ложные срабатывания от теней и обеспечьте понятность решений.

• Edge становится выгоднее при ~50 камерах, SaaS — при меньших объёмах. Jetson Orin AGX обрабатывает 8–12 потоков при амортизированной стоимости около 15 750 ₽ на камеру за 5 лет; облачный AI-сервис стоит 750–3 000 ₽ за камеру в месяц бессрочно.

• Комплаенс — это задача продукта, а не только юриста. GDPR, BIPA, CCPA и местные правила по видеонаблюдению напрямую влияют на пайплайны детекции аномалий. Храните метаданные, а не сырое видео; скелеты, а не лица; 90 дней, а не вечно.

Почему Фора Софт написала этот playbook по детекции аномалий

Фора Софт разрабатывает программное обеспечение для видеонаблюдения с 2005 года. Valt — наш многолетний референс в этой области: платформа для видеонаблюдения и анализа записей, которую используют правоохранительные органы, исследовательские и корпоративные службы безопасности. Мы также создаём инструменты для подключения камер по ONVIF, плагины для VMS и пайплайны AI-аналитики для интеграторов и продуктовых компаний. Практика видеонаблюдения — именно та область, где применяются шаблоны из этого playbook; команда AI-интеграции Фора Софт строит поверх них слой inference.

Каждый вендор VMS и интегратор систем безопасности, с которыми мы работали за последние два года, задавал один и тот же вопрос — только разными словами: «Как запустить детекцию аномалий, чтобы операторы не отключили её через неделю?» Этот playbook даёт на него ответ: какие модели использовать, какое оборудование ставить и где, как маршрутизировать события через ONVIF Profile M в Milestone / Genetec / Nx Witness, как пройти проверку на соответствие требованиям и что измерять, чтобы понимать, что система работает.

Прорабатываете AI-детекцию аномалий поверх уже работающей VMS?

30 минут с инженерным руководителем по видео. Приходите с вашей VMS, количеством камер и комплаенс-периметром — уйдёте с реалистичным планом: «edge или облако».

Позвоните нам → Напишите нам →

Что на самом деле означает «детекция аномалий в реальном мире»

В маркетинговых текстах в этот термин сваливают две совершенно разные задачи. В техническом задании их нужно разделять.

Детекция объектов отвечает на вопрос: есть ли в кадре человек, машина, номерной знак? Задача хорошо изучена, решается готовыми моделями уровня YOLO с точностью > 95 % по состоянию на 2026 год. Это необходимое условие, а не цель.

Детекция аномалий отвечает на вопрос: типично ли такое поведение для этой зоны в это время? Задача здесь — контекстная и временная. Человек, стоящий неподвижно в зале ожидания, — это нормально; тот же человек в той же позе в запретной зоне склада в 02:00 — уже инцидент. Для этого нужны покадровые признаки, модель «нормы» для каждой зоны и слой временного анализа, который реагирует на отклонения.

Типовые классы аномалий, которые реально доходят до продакшна:

Периметр: проникновение, пересечение виртуальной линии, перелаз через забор, несанкционированный въезд транспортного средства.
Поведенческие: бессмысленное болтание, зависание в запрещённых зонах, оставленные вещи, необычные маршруты движения.
Безопасность жизни: падения, поскользновения, потеря сознания, длительное пребывание в неподвижном состоянии.
Конфликты: драки, агрессия, скопления резкого движения, оружие.
Толпа: аномалии плотности, направление движения, встречные потоки, паническое рассеяние.
Транспорт: проезд на красный свет, движение против направления, превышение скорости, стоящие машины на проезжей части.

Ландшафт моделей в 2026 году: с учителем, без учителя, с самообучением

Обучение с учителем по-прежнему уместно, если у вас есть размеченный датасет «аномалия / норма» и узкий сценарий — например, недостача в рознице при конкретной планировке магазина. После обучения на датасете уровня UCF-Crime (1900 видео, 13 категорий аномалий) модель достигает 85–92 % AUC на бенчмарковых разбиениях. На новые камеры и новые сцены это не переносится без потерь.

Обучение с самообучением (self-supervised) — доминирующий подход для новых внедрений. Предобучают на большом неразмеченном видеокорпусе (Kinetics, YouTube-8M), а затем дообучают на 7–30 днях «нормального» видео с каждой платформы. Такой метод гораздо лучше адаптируется к предметной области — именно так устроены VideoMAE и современные трансформерные модели VAD.

Без учителя и со слабым учителем — Multiple Instance Learning (MIL), оценка плотности на автоэнкодерах, one-class SVM на глубоких признаках — работают, когда размеченных аномалий мало. MIL, в частности, рассматривает каждое видео как набор клипов и учится определять аномальные наборы без покадровой разметки; это подходящий инструмент для интеграторов безопасности, у которых есть часы записанных инцидентов, но нет точных временных меток и аннотаций.

Фреймворки, о которых стоит знать в 2026 году: RTFM (temporal feature magnitude), MGFN (моделирование признаков смесью гауссиан), PEL4VAD (совместный эмбеддинг внешнего вида и движения), а также волна трансформерных детекторов аномалий, выросшая из TimeSformer и ViViT. На публичных бенчмарках они показывают 80–88 % AUC; на продакшн-камерах — на 10–15 пунктов ниже, так что калибровка на ваших собственных данных — не опция, а требование.

Цифры бенчмарков против реального качества ваших камер

Разрыв между цифрами из статей и реальными показателями в работе — главная причина разочарования клиентов с VMS, которую мы наблюдаем на практике. Реалистичная картина:

Метрика	Бенчмарк (UCF-Crime)	Продукционная среда (обычно)	Цель оператора
AUC (ROC)	85–92 %	70–82 %	≥ 80 %
Ложные срабатывания / камера / день	н/д	2–5	< 1
Recall (бессмысленная болтовня)	~85 %	70–80 %	≥ 75 %
Recall (отзыв)	~80 %	60–75 %	≥ 85 %*
Задержка обнаружения вторжения	н/д	< 500 мс	< 500 мс
Задержка алерта о падении	н/д	2–5 с	< 5 с

*Recall на падениях должен быть высоким: пропуск может стоить жизни. За это можно заплатить ростом ложных срабатываний.

Edge или облако: выбор места развёртывания, который влияет на экономику

Edge-инференс запускает модель прямо на устройстве — на Jetson Orin, Hailo-8, Coral или даже внутри камеры на чипе Ambarella CVflow. Видео остаётся на месте; за пределы периметра выходят только оповещения и 5–10 секунд подтверждающего видео. Задержка составляет 50–200 мс, конфиденциальность обеспечивается изначально, а эксплуатационные расходы остаются низкими после первоначальных вложений в оборудование.

Облачный инференс отправляет RTSP-потоки в управляемый GPU-пул (AWS, Azure, GCP или специализированные провайдеры вроде NVIDIA Metropolis / Eagle Eye Networks). Задержка — от 500 до 2000 мс, капитальные затраты почти отсутствуют, операционные расходы стабильны и предсказуемы.

Гибрид — это то, к чему в итоге приходят все: edge используется для анализа в реальном времени и отсеивания ложных срабатываний, а облако — для еженедельного дообучения, анализа трендов и аудита. Такой подход совпадает с тем, как устроены продукты вендоров VMS: локальные рекордеры обрабатывают видео, а облако отвечает за администрирование и отчётность.

Берите edge, когда: важна задержка (< 500 мс), приватность не позволяет отправлять видео наружу или у вас 50+ камер, на которых амортизированная стоимость железа уже выгоднее SaaS-оплаты.

Берите облако, когда: у вас меньше 20 камер, нужен масштаб для нескольких клиентов без выезда на объект, а команда не хочет заниматься обслуживанием edge-устройств.

Берите гибрид, когда: вы вкладываетесь надолго — держите инференс на edge, дообучение и работу с моделью в облаке, а историю и комплаенс — в порядке.

Железо в 2026 году: Jetson, Hailo, Coral, Ambarella

Устройство	Производительность	Энергопотребление	Потоки (1080p)	Примерная цена	Где уместно
Jetson Orin Nano	40 TOPS	5–10 Вт	1–2	15–22 тыс. ₽	Маленькая розница, edge у киоска
Jetson Orin NX	100 TOPS	10–15 Вт	2–4	37–52 тыс. ₽	Средний сегмент, многокамерные объекты
Jetson Orin AGX	275 TOPS	40–60 Вт	8–12	150–187 тыс. ₽	Корпоративный on-rem хаб аналитики
Hailo-8	26 TOPS (INT8)	2,5 Вт	4–8 (только детекция)	30–45 тыс. ₽	Компактные, энергоэффективные установки
Coral Edge TPU	4 TOPS (INT8)	2–3 Вт	1 (лёгкие нагрузки)	6–11 тыс. ₽	Сверхнизкое энергопотребление, аксессуар
Ambarella CVflow (в камере)	8–16 TOPS	2–5 Вт	1–2 (внутри камеры)	лицензия на устройство	Умные камеры, OEM-интеграции

Практический выбор интегратора, который в 2026 году собирает многокамерный объект, — семейство Jetson Orin: Nano для миниатюрных устройств, NX для среднего сегмента, AGX — как локальный сервер аналитики для корпоративных решений. Hailo выигрывает там, где важен энергопотребление (периметры на солнечных батареях, установка на транспорт, компактные NVR-устройства).

ONVIF Profile M: как события аномалий реально доходят до вашей VMS

Детекция аномалий без интеграции с VMS — это скорее научный эксперимент, чем готовый продукт. ONVIF Profile M — стандартный способ передачи аналитических метаданных вместе с видео. Именно этот путь уже поддерживают большинство плагинов для Milestone, Genetec и Nx Witness. В нашей подробной статье про ONVIF-профили в системах безопасности мы разбираем всё семейство стандартов.

Поток в продакшн-развёртывании:

1. Edge-инференс. Устройство класса Jetson подключается к камере по RTSP, запускает модель детекции аномалий и передаёт метаданные Profile M вместе с RTP-потоком.

2. Приём в VMS. Системы Milestone XProtect, Genetec Security Center, Nx Witness или Avigilon Control Center получают метаданные через плагин или встроенный драйвер. Алерты отображаются на временной шкале оператора, а рамки распознавания — при воспроизведении видео.

3. Движок правил. Настройка порогов по зонам, маршрутов эскалации и назначение операторов. Типичная точка входа — движок правил Nx Witness и алерты Smart Client в Milestone; у Genetec используется собственная проприетарная система правил.

4. SIEM / управление инцидентами. Алерты высокой важности отправляются через вебхук в Splunk, Sentinel или SOAR-платформу; службы безопасности сопоставляют их с событиями контроля доступа и сетевыми данными от IDS.

Ловушка: соответствие Profile M у вендоров VMS неравномерное. В поле закладывайте 20–30 % расхождений по схеме. Проверяйте на реальном экземпляре VMS, прежде чем подписываться под цифрами проекта.

Ложные срабатывания — проблема, которая реально может погубить проект

Операторы сталкиваются с менее чем одним необъяснённым алертом на камеру в день — после этого они отключают каналы или выключают зоны. Всё, что выше этого порога, — провал продукта, даже если показатель recall на бумаге выглядит прилично. Пять повторяющихся причин:

1. Тени и смена освещения. Угол солнца меняется в течение дня. Метод PCA-вычитания фона воспринимает движение теней как движение объектов. Проблема решается с помощью адаптивной модели фона на основе смеси гауссиан, которая обновляется каждые 24–48 часов, а также детекторами, учитывающими тени на границе объектов.

2. Вибрация камеры. Ветер на камере на столбе, тряска от вентиляции, дрожь от транспорта — всё это вызывает ложные срабатывания детектора движения. Префильтр стабилизации (на основе гомографии) и минимальные пороги по амплитуде движения позволяют отсеивать простые случаи.

3. Дрейф базовой линии. Магазин переставил витрины — «норма» изменилась. Склад добавил погрузочную зону — маршруты людей сдвинулись. Закладывайте ежеквартальный пересмотр базовой линии как операционную гигиену, а не как тушение пожаров.

4. Погода. Дождь на объективе, снег на земле, туман — всё это снижает контраст. Используйте сезонные окна дообучения и пороги, учитывающие погодные условия (например, снижайте чувствительность при сильных осадках и информируйте оператора о режиме).

5. Переходы сцены. Движение камеры PTZ, смена фокуса, включение ИК-подсветки в сумерках. На N секунд после любого изменения сцены отключайте оповещения — это патч из 20 строк, который спасает рассудок оператора.

Закладывайте 4–8 недель на калибровку на каждой площадке после установки. «Подключай и работай» — это маркетинговый лозунг, а не реальность внедрения.

Боротьесь с высоким уровнем ложных срабатываний в работающем внедрении?

Мы настраивали VAD-пайплайны в рознице, логистике и продуктах, близких к правоохранительной сфере. За 30 минут — готовый план действий.

Позвоните нам → Напишите нам →

Кейсы с цифрами: розница, логистика, периметр, города, забота о людях

Розница, предотвращение потерь. Целевая недостача — 1–2 % от инвентаря, на практике — 2–4 %. Отслеживаемые аномалии: задержки у дорогих полок, подмена ценников, подозрительное поведение в слепых зонах. Сеть из 50 магазинов может получить ощутимую шестизначную экономию в рублях в год, если система распознавания аномалий внедрена правильно. Стоимость на одну точку — 60–90 тыс. ₽ за edge-узел плюс интеграция. Подробно эту тему мы разбираем в статье про видеоаналитику в рознице.

Безопасность на складе. По данным OSHA, на каждые 1000 работников в среднем приходится 2–4 случая падений из-за скольжения в год. Обнаружение падения с задержкой 2–5 секунд позволяет быстрее среагировать аварийным службам. Один предотвращённый серьёзный инцидент окупает установку системы на отдельном объекте. Для покрытия 1000 м² требуется 8–12 камер, стоимость установки — 375–600 тыс. ₽.

Периметровая безопасность (аэропорты, тюрьмы, границы). Обнаружение проникновения с задержкой менее 500 мс. Допустимое количество ложных срабатываний — не более 0,2 на камеру в день. Используются модели 3D CNN с высокой временной согласованностью. На объект устанавливается от 24 до 72 камер; полная реализация системы обычно обходится в 15–37 млн ₽ с учётом оборудования, интеграции и калибровки, которая занимает шесть–восемь недель.

Умные города и транспорт. Проезд на красный свет, движение против направления, машины, стоящие на действующих полосах. Задержка распознавания — 1–3 с, чтобы система могла применить санкции. Обычно в городе 50–500 перекрёстков, бюджет — от 3,7 до 37 млн ₽ и выше в зависимости от масштаба; система интегрируется с уже работающими системами управления трафиком SCATS / SCOOT.

Забота о пожилых и независимое проживание. Обнаружение падений и длительной неподвижности. Анализ на основе скелетной модели (без распознавания лица, без идентификации личности) — для соответствия требованиям HIPAA и GDPR. Целевой уровень обнаружения — 85–95 %; менее 0,5 ложных срабатываний на комнату в день, чтобы родственники не утомлялись от уведомлений. 1–2 камеры на комнату; стоимость интеграции — 150–375 тыс. ₽ на одного жильца.

Модель затрат: SaaS против edge, TCO на 5 лет

Две ориентировочные модели для решения вопроса «строить или покупать». SaaS-сервис AI-детекции аномалий обычно стоит 750–3 000 ₽ за камеру в месяц — цена зависит от полноты функционала и уровня SLA. Развёртывание на edge-устройствах позволяет амортизировать затраты на оборудование, монтаж и обслуживание за 5 лет.

Модель	Капекс	Опекс / год	TCO за 5 лет / камера
SaaS AI (средний сегмент)	~0 ₽	18–27 тыс. ₽ / камера	90–135 тыс. ₽
Edge (Jetson Orin AGX, 8 камер)	~30 тыс. ₽ / камера	~4 500 ₽ / камера	52–67 тыс. ₽
Гибрид: edge + дообучение в облаке	~30 тыс. ₽ / камера	9–13 тыс. ₽ / камера	75–97 тыс. ₽

Точка безубыточности между edge и SaaS — около 40–60 камер в портфеле. Ниже этой отметки выгоднее SaaS, особенно если учесть инженерное дежурство и обновление оборудования. Выше — амортизация edge-решений становится существенной, зато выигрывают приватность и низкая задержка.

Комплаенс: GDPR, BIPA, CCPA и местные правила по видеонаблюдению

GDPR (ЕС). Запись с камер — это персональные данные; обработка биометрической информации (например, лицо или походка) относится к особой категории по статье 9. Требуется правовое основание: законный интерес — для охраны периметра, договор — для контроля за сотрудниками, а согласие почти никогда не подходит при масштабном использовании. Обязательно заключайте DPA с каждым процессором и публикуйте список субпроцессоров. Метаданные без привязки к личности — например, событие, зона и время — самый простой способ обеспечить защиту.

BIPA (штат Иллинойс). Biometric Information Privacy Act требует письменного информированного согласия на использование биометрических данных — например, отпечатков лица, походки или геометрии руки. Риск коллективных исков реальный: штраф за нарушение — от 75 до 375 тыс. ₽. Если вы разрабатываете розничные или внутренние корпоративные продукты с детекцией аномалий, избегайте функций, основанных на идентификации личности, пока не настроите процесс получения согласия. Анализ скелетной модели и ключевых точек позволяет обойти большинство рисков BIPA.

CCPA (Калифорния). Потребители имеют право знать, удалять свои данные и отказаться от их обработки. Обязательно информировать о наличии камер и аналитики на основе ИИ. Контроль за наблюдением в полупубличных местах, например в магазинах, строже, чем на частных рабочих местах.

Местные регламенты. В Сан-Франциско и Окленде запрещено использовать распознавание лиц муниципальными службами; в Нью-Йорке действуют строгие требования к хранению и обработке биометрических данных. В Портленде (Орегон) частным компаниям запрещено применять распознавание лиц в общественных местах. Ожидайте, что таких городов станет всё больше.

Принцип минимизации данных. Храните метаданные об аномалии и 10-секундный фрагмент видео вокруг события, а не круглосуточную запись. Удаляйте исходные видео через 30–90 дней, если только они не связаны с конкретным инцидентом. Для аналитики, где не нужна идентификация людей, используйте скелеты и тепловые карты. Такой подход решает большинство претензий регуляторов одним решением.

Паттерны интеграции: ONVIF, вебхуки, MQTT, SDK для VMS

Четыре пути интеграции, выбираются под конкретную VMS и стек безопасности:

1. ONVIF Profile M. По умолчанию используется в популярных VMS. Метаданные аналитики передаются по той же RTSP-сессии, что и видео. Milestone, Nx Witness, Avigilon поддерживают его нативно; у Genetec поддержка частичная.

2. REST-вебхуки. JSON-данные вида event.anomaly.loitering отправляются на эндпоинт вебхука в SIEM клиента. Самый простой способ интеграции для приёмников, не являющихся системами видеонаблюдения (VMS).

3. MQTT. Publish-subscribe через брокер — удобно в IoT-средах и на объектах с узким каналом. Нагрузка ниже, чем у REST; операторы подписываются на топики по зонам.

4. SDK для VMS. Milestone MIP SDK, REST + движок правил Nx Witness, SDK Genetec (более жёсткий вендорский контроль), плагинная инфраструктура Avigilon. Используются, когда VMS — основной интерфейс для клиента и нужна тесная интеграция с таймлайном и воспроизведением.

UX оператора: понятность важнее чистой точности

Алерт с точностью 92 % без подтверждения всегда проигрывает алерту с точностью 80 %, у которого есть чёткая рамка, временная тепловая карта и кнопка, показывающая 10 секунд до и после события. Объяснимость вызывает доверие, а доверие — принятие. Пять UX-решений, которые реально влияют на метрики:

1. Рамки и тепловые карты при воспроизведении. Оператору важно видеть, что именно обнаружила модель, а не только метку события.

2. Уверенность в корзинах, а не в сыром числе. «Высокая / средняя / низкая», а не 0,87. Операторы не настраивают модель, они сортируют события.

3. Кнопка «это не аномалия» в один клик. Отправляется в еженедельный цикл дообучения. Операторы чувствуют, что их услышали, и петля качества замыкается.

4. Уровень тяжести по зонам. Один и тот же класс события в хранилище и в комнате отдыха означает разное. Пусть администратор настраивает уровни для каждой зоны.

5. Таймлайн алертов с причинно-следственным контекстом. Показывайте последние три события в той же зоне и данные систем контроля доступа. Операторы воспринимают ситуацию как последовательность событий, а не отдельные инциденты.

Мини-кейс: детекция аномалий, подключённая к существующему VMS-внедрению

Ситуация. Интегратор безопасности с мультисайтовыми видеовнедрениями хотел добавить AI-детекцию аномалий (болтание, проникновение, прорыв периметра) поверх уже работающих VMS — без замены камер и без переобучения клиентов. Операторы и так были перегружены; новая функция не должна была создавать лишний шум.

12-недельный план. Недели 1–2: обследование двух пилотных объектов, анализ 30 дней записанного видео с каждой камеры, построение базовой модели «нормы» для каждой камеры. Недели 3–5: установка edge-узла Jetson Orin NX на каждые 4 камеры, внедрение VAD-цепочки на основе faster-whisper, публикация метаданных по стандарту ONVIF Profile M. Недели 6–7: интеграция плагина с Milestone XProtect, отображение рамок на временной шкале, настройка приоритетов по зонам. Недели 8–10: этап калибровки — устранение ложных срабатываний от теней, фильтрация вибраций камер, настройка порогов по зонам, еженедельное дообучение модели. Недели 11–12: поэтапный запуск через фича-флаг, обучение операторов, введение регламента ежеквартального пересмотра базовой модели.

Результат. Количество ложных тревог снизилось с 6–8 на камеру в день в первую неделю до менее чем одной на камеру в день после настройки. Уровень принятия решения операторами оставался выше 80% в течение четырёх недель (мы отслеживаем это отдельно, поскольку типичный сбой — тихое отключение каналов). В следующем квартале ещё два объекта клиентов развернули внедрение, опираясь на результаты пилота.

Фреймворк решения: пять вопросов

1. Сколько камер и на скольких объектах? < 20 → SaaS. 20–50 → гибрид. > 50 → edge с дообучением в облаке.

2. Какой допуск по задержкам? Падения с угрозой жизни, проникновение периметра → edge обязателен. Предотвращение потерь без срочности → облако подойдёт.

3. Какая VMS уже стоит у клиента? Milestone или Nx Witness → ONVIF Profile M даёт чистый путь. Genetec → закладывайте время на проприетарный SDK. Avigilon → плагинная инфраструктура.

4. Каков регуляторный периметр? ЕС / штат с BIPA / зоны с муниципальным запретом → отключайте функции, связанные с идентификацией; собирайте аналитику на скелетных точках и ключевых узлах; минимизируйте данные с самого начала.

5. Кто отвечает за обучение операторов и калибровку? Если у клиента нет команды по безопасности, способной провести калибровку в течение 4–8 недель, включайте управляемый сервис в сделку. Передача детекции аномалий неподготовленным операторам почти наверняка приведёт к потере клиента.

Пять подводных камней, которые топят проекты по детекции аномалий

1. Использование предобученных моделей как есть. Сети, обученные на UCF-Crime, теряют 10–20 пунктов AUC на камерах в реальных условиях. Дообучайте модель на локальном видео; закладывайте 4–8 недель на калибровку при внедрении.

2. Нет порогов по зонам. Один глобальный порог уверенности либо вызывает слишком много ложных срабатываний в открытых местах, либо пропускает события в важных зонах. Настройка порогов по зонам и учёта серьёзности событий по их классам — минимально достаточный набор параметров.

3. Нет сезонного дообучения. Весенний дождь, осенняя листва, зимний снег сбивают с толку модели, обученные на летнем видео. Квартальные циклы дообучения — это операционная гигиена, а не пункт в дорожной карте.

4. Функции на основе идентичности без процесса согласия. Распознавание лиц хорошо работает в демонстрациях, но проваливает проверку на соответствие требованиям в реальной эксплуатации. Сначала создавайте систему без использования персональных данных; добавляйте идентификацию только по явному согласию пользователя и там, где это разрешено законом.

5. Отношение к интеграции с VMS как к «сантехнике». Отличная модель, но плохой плагин — бесполезная функция. Вкладывайтесь в UI-слой VMS так же серьёзно, как в слой инференса.

KPI: что измерять с первого дня

KPI качества. AUC на ежемесячной выборке, размеченной людьми (цель ≥ 80 % в продакшне). Ложные срабатывания на камеру в день (цель < 1 для критичных зон). Recall по аномалиям, угрожающим жизни (цель ≥ 85 % для падений).

Операционные KPI. Вовлечённость оператора — доля алертов, по которым были приняты меры в течение 5 минут (цель — не менее 80 % для алертов высокой тяжести). Доля отключённых каналов (цель — 0 % после 4-й недели). Время цикла дообучения (цель — не более 2 недель от получения обратной связи до внедрения в продакшн).

Бизнес-метрики. Доля закрытых инцидентов на объекте после внедрения (цель — заметный рост за два квартала). ROI по страховке и недостаче — по кварталам. Количество корпоративных продлений, где AI-аналитика указана как обязательное условие.

Когда детекцию аномалий запускать НЕ стоит

Если у вас разношёрстные камеры потребительского уровня и вы не можете привести разрешение и частоту кадров к единому стандарту, сначала потратьте бюджет на их обновление. Модели аномалий не исправят плохое качество входных данных. Если операторы уже перегружены текущими оповещениями, внедрение детекции аномалий сначала усугубит ситуацию — поэтому заранее перепроектируйте рабочие процессы параллельно с AI-проектом, а не после его запуска. Если клиенты находятся в юрисдикции, где видеонаблюдение запрещено (например, частный сектор в Портленде, штат Орегон, или часть муниципальных объектов в Сан-Франциско), проведите юридическое согласование до запуска системы, а не после.

Готовы превратить существующую VMS в AI-платформу безопасности?

Мы разрабатываем плагины для VMS, edge-стек инференса и пайплайны ONVIF Profile M. 30 минут — конкретный план для вашего парка, без слайдов ради слайдов.

Позвоните нам → Напишите нам →

FAQ

Можно ли просто взять предобученную модель UCF-Crime с Hugging Face?

С этого можно начать. Закончить на этом нельзя. Модели, обученные на бенчмарках, теряют 10–20 пунктов AUC на реальных камерах из-за различий в освещении, ракурсах, разрешении и разнообразии сцен. Отводите 4–8 недель на дообучение на видео с конкретной площадки; используйте предобученные веса только как отправную точку.

Какой реалистичный уровень ложных тревог для детекции аномалий в продакшене?

Меньше 1 алерта на камеру в день — норма для строгих аномалий в критичных зонах. 2–3 алерта на камеру в день — допустимый уровень для широких поведенческих алертов в открытых местах. Всё, что выше, — операторы отключат канал; это провал продукта, а не просто плохо настроенная система.

Edge или облако — что выбрать?

Гибрид. Edge — для обнаружения в реальном времени и отсева ложных срабатываний; облако — для еженедельного дообучения, анализа долгосрочных трендов и аудита. Точка безубыточности между чистым SaaS и гибридной моделью с акцентом на edge находится в диапазоне 40–60 камер в портфеле клиента.

Как избежать нарушений GDPR и BIPA?

Храните метаданные событий, а не исходное видео. Используйте аналитику на основе скелетной модели и ключевых точек вместо распознавания лиц, где это возможно. Ограничьте срок хранения данными 30–90 дней, дольше — только для конкретных помеченных инцидентов. Заключайте соглашения о обработке персональных данных (DPA) с каждым облачным провайдером. Откажитесь от биометрических функций, связанных с идентификацией, если нет чётко задокументированного процесса получения согласия. Сделайте всё это до запуска системы, а не после.

Поддерживает ли моя VMS ONVIF Profile M?

Milestone XProtect: да, через плагины. Nx Witness: да, нативно и через REST. Avigilon: в основном — через плагинную инфраструктуру. Genetec: частично, нужно использовать проприетарное SDK. Соответствие схеме неравномерное; закладывайте 2–3 недели на интеграционное тестирование с конкретной версией VMS, установленной у клиента.

Сколько камер тянет Jetson Orin AGX?

8–12 одновременных потоков 1080p при 10–15 кадрах в секунду для моделей детекции аномалий средней сложности; 4–6 потоков для более тяжёлых трансформерных моделей при 30 кадрах в секунду. Jetson Orin NX справляется с 2–4 потоками; Orin Nano — с 1–2. Закладывайте 25 % запаса, чтобы компенсировать различия в кодеке и всплески нагрузки в дождливый день.

Сколько займёт запуск на работающем объекте?

10–14 недель на внедрение в продакшн поверх существующей VMS с командой Фора Софт на инструментах Agent Engineering: обследование площадки, установка edge-оборудования, интеграция ONVIF Profile M, прохождение калибровки, обучение операторов, поэтапный запуск. Мультисайтовые пилоты добавляют 3–4 недели на калибровку каждой площадки.

Работает ли детекция аномалий с устаревшими аналоговыми камерами?

Только через IP-энкодер с приемлемым разрешением (минимум 1080p). Аналоговые потоки с разрешением ниже 1080p теряют слишком много деталей для надёжной детекции аномалий. Если у клиента в основном устаревшие аналоговые камеры, планируйте их замену до или одновременно с внедрением ИИ: это более выгодная инвестиция, чем пытаться получить качественный результат с неподходящим входным сигналом.

Что почитать дальше

Видеонаблюдение

Детекция аномалий в видеонаблюдении в реальном времени

Инженерный спутник в реальном времени: потоковая обработка, маршрутизация событий, удобный интерфейс оператора для онлайн-мониторинга.

Протоколы

ONVIF Profile M и детекция объектов

Протокол метаданных, по которому ваши события аномалий передаются от edge к VMS.

Архитектура

ONVIF-профили в системах безопасности

Обзорный материал по семейству ONVIF-профилей (S, T, G, M) и тому, как они работают вместе.

Розница

Видеоаналитика в рознице: искусственный интеллект для магазина

Отраслевой взгляд на предотвращение потерь, недостач и поведенческую аналитику в торговом зале.

Аналитика

Видеоаналитика в реальном времени: 4 бизнес-сценария

Бизнес-подход к видеоаналитике в реальном времени в рознице, безопасности и операционной деятельности.

Готовы запустить детекцию аномалий, которую операторы реально не отключат?

Рабочий паттерн оказывается острее, чем кажется из маркетинга. Выбирайте модели с самообучением или с учителем-руководителем, а не просто бенчмарковые сети. Развертывайте edge-вывод на железе уровня Jetson для задач, чувствительных к задержкам, и дополняйте дообучением в облаке. Маршрутизируйте события через ONVIF Profile M в ту VMS, которой клиент уже доверяет. Тратьте столько же усилий на подавление ложных срабатываний, настройку чувствительности по зонам и понятный интерфейс, сколько на саму модель.

Выигрывают те проекты, где комплаенс, калибровка и доверие оператора рассматриваются как важная часть разработки, а не как дополнительные задачи. Проигрывают те, что запускают модель с точностью 92 %, переживают четырёхнедельный «медовый месяц» с ложными срабатываниями, а потом молча наблюдают, как операторы отключают каналы. Мы внедряли детекцию аномалий, интегрированную с VMS, в среды рядом с правоохранительными органами, в логистику и розницу; полная раскатка в продакшн поверх существующего парка оборудования занимает 10–14 недель.

Давайте обсудим раскатку детекции аномалий у вас

Приходите с вашей VMS, количеством камер и комплаенс-периметром. 30 минут, конкретный план, без слайдов с продажным уклоном.

Позвоните нам → Напишите нам →

Технологии

Показатель	Цифра за 2025	Что это значит для вас
Выручка мобильных приложений с генеративным ИИ	225 млрд ₽, +273% год к году	Самостоятельное AI-приложение теперь — полноценный продукт, а не просто функция.
Время в приложениях с генеративным ИИ	48 млрд часов (×3,6 к 2024)	Привычка у пользователей сформировалась — ассистенты теперь конкурируют с вашим приложением за время сессии.
Внедрение разработчиками	63% выпускают не менее одной AI-функции	Не выпускать ИИ в 2026 году — это уже конкурентное отставание, а не нейтральный выбор.
Прирост вовлечённости от персонализации	+62% вовлечённости, +80% конверсии	Одни только AI-рекомендации влияют на финансовый результат.
Пользователи мобильных AI-ассистентов (США)	200 млн+ (110 млн — только на мобильных)	Пользователи ожидают, что голосовой и текстовый ИИ будет работать везде.
Прогноз Gartner	Использование мобильных приложений снизится на 25% к 2027 году (из-за AI-ассистентов)	Приложения без встроенного ИИ будут терять пользователей в пользу системных ассистентов.

Фреймворк / API	Платформа	Лучше всего для	Типичная задержка	Структура затрат
Core ML	iOS, macOS, watchOS	Зрение и NLP на устройстве с Apple Neural Engine	< 100 мс	Разовая, внутри приложения
Apple Foundation Models	iOS 18+, macOS 15+	LLM на устройстве, резюмирование, инструменты письма	< 500 мс	Бесплатно (в составе ОС)
TensorFlow Lite / LiteRT	Android, iOS, Web	Кроссплатформенное ML на устройстве	< 200 мс	Разовая, внутри приложения
MediaPipe	Android, iOS, Web	Поза, руки, лицо, жесты, сегментация	< 100 мс	Разовая, внутри приложения
ML Kit (Google)	Android, iOS	Распознавание текста, штрихкоды, перевод, обнаружение лиц	50 мс–2 с	Бесплатный тариф + оплата за запрос
Gemini Nano (AICore)	Android (Pixel 9+, S26+)	LLM на устройстве, резюмирование, подсказки ответов	< 1 с	Бесплатно (в составе ОС)
ONNX Runtime Mobile	Android, iOS, Web	Переносимые модели между фреймворками	< 300 мс	Разовая, внутри приложения
OpenAI API (GPT-5)	Облако	Рассуждения, код и зрение уровня state-of-the-art	1–3 с	93,75–750 ₽ за 1 млн токенов
Anthropic Claude API	Облако	Рассуждения с длинным контекстом, анализ, код	1–3 с	75–1 875 ₽ / 1 млн токенов (скидка 50% при батч-обработке)
Google Gemini API	Облако	Мультимодальность, экономичный текст и зрение	1–2 с	6–375 ₽ / 1 млн токенов
AWS Rekognition	Облако	Анализ изображений и видео, модерация	500 мс–2 с	0,075–0,9 ₽ за изображение
Azure Cognitive Services	Облако	Корпоративное видение, стиль общения, язык	500 мс–2 с	За запрос + подписка

Объём	Пример функции	Сроки	Ориентировочная стоимость
Одна функция на устройстве	Сканирование документа + OCR	4–8 недель	2–6 млн ₽
Гибрид среднего размера	Зрение на устройстве + облачный LLM-чат	8–14 недель	6–13,5 млн ₽
Полноценный гибрид под продакшн	Оркестрация нескольких моделей, RAG, мониторинг	14–22 недели	11,2–22,5 млн ₽
Корпоративная платформа	Регулируемая отрасль (здравоохранение / финтех), несколько регионов, SLA	22+ недели	от 22,5 млн ₽

Платформа	Для чего лучше всего	Стартовая цена	Нужна гарнитура?
ClassVR	Школа (K–12), более 1 500 сценариев по учебной программе	от 75 000 ₽ за школьный комплект	Да (гарнитуры в комплекте)
Labster	Лаборатории биологии, химии, физики в вузах	5 925–8 175 ₽ за студента в год	Нет (браузер + опционально VR)
Nearpod (с VR)	Встраивание в уроки в школе	11 925–29 775 ₽ в год на преподавателя	Опционально
zSpace	AR/VR без гарнитуры; более 3 500 округов	По запросу (фирменное оборудование)	Нет (очки + дисплей с трекингом)
Prisms VR	Математика и естественные науки, 140 округов	По запросу (лицензия округа)	Да
Engage / Spatial	Совместные классы в высшем образовании	37 500–150 000 ₽ в год за помещение	Да (несколько устройств)
CoSpaces Edu	VR-проекты, которые создают сами ученики	75–225 ₽ за ученика в год	Опционально
Osso VR / FundamentalVR	Хирургическая подготовка	450 000–3 млн ₽ в год за рабочее место	Да

Статья расходов	Год 1	Год 2 и далее
30 × Meta Quest 3S (комплект за 37 500 ₽)	1 125 000 ₽	0 ₽ (обновление раз в 3–4 года)
Контент-платформа (ClassVR / Nearpod)	150 000–375 000 ₽	150 000–375 000 ₽
Обучение преподавателей (1 день)	112 500–225 000 ₽	Обновление: 37 500 ₽/год
Зарядная станция + MDM	112 500–187 500 ₽	0 ₽
Страховка / поломки (10%)	112 500 ₽	112 500 ₽
Итого	1,6–2 млн ₽	300 000–525 000 ₽

Обнаружение аномалий в видеонаблюдении: практическое руководство по VMS на 2026 год

Почему Фора Софт написала этот playbook по детекции аномалий

Что на самом деле означает «детекция аномалий в реальном мире»

Ландшафт моделей в 2026 году: с учителем, без учителя, с самообучением

Цифры бенчмарков против реального качества ваших камер

Edge или облако: выбор места развёртывания, который влияет на экономику

Железо в 2026 году: Jetson, Hailo, Coral, Ambarella

ONVIF Profile M: как события аномалий реально доходят до вашей VMS

Ложные срабатывания — проблема, которая реально может погубить проект

Кейсы с цифрами: розница, логистика, периметр, города, забота о людях

Модель затрат: SaaS против edge, TCO на 5 лет

Комплаенс: GDPR, BIPA, CCPA и местные правила по видеонаблюдению

Паттерны интеграции: ONVIF, вебхуки, MQTT, SDK для VMS

UX оператора: понятность важнее чистой точности

Мини-кейс: детекция аномалий, подключённая к существующему VMS-внедрению

Фреймворк решения: пять вопросов

Пять подводных камней, которые топят проекты по детекции аномалий

KPI: что измерять с первого дня

Когда детекцию аномалий запускать НЕ стоит

FAQ

Что почитать дальше

Готовы запустить детекцию аномалий, которую операторы реально не отключат?

Похожие статьи

Хотите обсудить ваш проект?