Главное

AI-видеоаналитика — это уже не вендорское демо. Современное железо (Hailo-8, Jetson Orin) и зрелые модели (YOLO26, MMAction) обеспечивают аналитику в реальном времени прямо на устройстве. В 2026 году вопрос звучит не «работает ли это», а «какие 2–3 категории дадут моей вертикали ROI 10× и выше».

Восемь категорий аналитики покрывают 95 % сценариев. Детекция объектов, трекинг, анализ поведения, плотность толпы, распознавание автомобильных номеров, детекция лиц, контроль СИЗ, тепловые карты. Берите 2–3 на вертикаль — не пытайтесь запустить все восемь сразу.

Категоризация рисков по EU AI Act действует с 2025 года. Мониторинг рабочих мест, биометрическая идентификация и предиктивная полиция попадают в категорию «высокого риска» с обязательной документацией, надзором человека и постмаркет-мониторингом. Закладывайте соответствие нормам с первого дня.

ROI по вертикалям: предотвращение потерь в ритейле — 10–15× за 18 месяцев; безопасность на стройке — снижение страховых премий на 30–50 %; умный город — сокращение времени детекции инцидентов на 60–80 %. Кейсы зрелые, и вендоры конкурируют уже не возможностями, а глубиной интеграции.

Сначала пилот, потом покупка. 4–6 недель на реальном видео с 2–3 кандидатами на вендора дают больше, чем любая брошюра. Бенчмарки вендоров не переносятся на ваши условия.

Почему Фора Софт написала этот гайд

С 2005 года Фора Софт реализовала более 50 проектов по видеонаблюдению, VMS и видеоаналитике. EyeBuild для аналитики на стройке, VALT для юридического e-discovery, Live Eye Surveillance, NetCamStudio — плюс несколько NDA-проектов в ритейле и на транспорте.

Если вы продакт-менеджер умных зданий, директор по предотвращению потерь в ритейле, оператор транспортной системы или PM на стройке и оцениваете AI-видеоаналитику — этот материал даёт независимый взгляд интегратора на архитектуру, модели, вендоров и ROI. Без вендорской подачи.

Нужен независимый аудит видеоаналитики?

Пришлите количество камер, вертикаль и целевые события. В течение 48 часов мы вернёмся с независимой от вендоров архитектурой и прогнозом ROI. Бесплатно.

Позвоните нам → Напишите нам →

Что такое AI-видеоаналитика в 2026 году

AI-видеоаналитика — это применение моделей компьютерного зрения к видеопотокам, чтобы извлекать структурированные события: людей, транспорт, объекты, поведение. Дальше эти события потребляют смежные системы. К 2026 году категории зрелые: предобученные модели (YOLO26, DETR, SAM2, MMAction) закрывают 80 % сценариев из коробки; оставшиеся 20 % требуют доменного дообучения.

Что изменилось за последние 24 месяца: edge-инференс стал стандартом. Hailo-8 и Jetson Orin Nano выдают 30 fps детекции в 1080p при потреблении ниже 10 Вт. Чисто облачные развёртывания ещё встречаются, но это ловушка по стоимости. Разговор об архитектуре теперь идёт в формате «edge или гибрид», а не «облако или edge».

Поменялось и регулирование. Категоризация рисков по EU AI Act (действует с 2025 года) и обновлённое применение статьи 9 GDPR к биометрии переносят вопросы соответствия в фазу проектирования — а не в авральный запуск.

8 категорий аналитики

1. Детекция объектов. Человек, транспорт, посылка, оружие, СИЗ. База всего стека. YOLO26 и YOLOv9 — рабочие лошадки; производные DETR хорошо показывают себя на загромождённых сценах.

2. Трекинг объектов и реидентификация. Один и тот же человек на разных камерах. Критично для движения толпы, аналитики покупательского пути в ритейле, отслеживания периметра. ByteTrack, BoT-SORT и StrongSORT — SOTA 2026 года.

3. Анализ поведения. Слоняние, падение, оставленный предмет, драка, аномальная траектория. Сочетание трекинга, оценки позы и временных моделей. Доминируют MMAction и сети SlowFast.

4. Плотность и поток толпы. Оценка плотности (голов на квадратный метр), направление потока, детекция узких мест. Критично для стадионов, транспортных узлов, ритейла. Лидеры 2026 — CSRNet и CrowdCountFormer.

5. Распознавание автомобильных номеров (LPR). Доступ на парковку, платные дороги, трафик. Зрелая категория — работает и OpenALPR, и решения, встроенные в вендоров. Новый угол 2026: privacy-aware LPR со сличением прямо на устройстве по списку допуска, без отправки в облако.

6. Детекция и распознавание лиц. Это две разные задачи. Детекция (есть ли в кадре лицо?) обычно безопасна. Распознавание (чьё это лицо?) подпадает под статью 9 GDPR (особая категория данных) и под высокорисковую классификацию EU AI Act. Используйте экономно и только при чётком бизнес-обосновании.

7. Контроль СИЗ. Каска, жилет, перчатки, очки. Стройка и промышленность. Доменное дообучение YOLO26 на размеченных данных по СИЗ. Фора Софт реализовала такие проекты для строительных и производственных клиентов.

8. Тепловые карты и время пребывания. Где покупатели проводят время в магазине, где пассажиры скапливаются на станции. Анонимизированные данные о локации, агрегированные во времени. Двигают решения по мерчандайзингу, планировке и расстановке персонала.

Эталонная архитектура — edge, облако, гибрид

Доминируют три паттерна развёртывания. Гибрид — стандарт 2026 года для любого серьёзного проекта; чистый edge — там, где ограничены бюджет или связь; чистое облако — для разовых форензик-задач малого объёма.

ПаттернГде идёт инференсСтруктура расходовКогда подходит
Только edgeNPU камерыКапекс на железо; opex почти нулевойОграниченная связь, приоритет приватности, >50 камер
Только облакоGPU в AWS/GCP/AzureOpex за каждый инференс<30 камер, форензик-анализ, прототипирование
ГибридEdge — быстрый фильтр; облако — глубокая верификацияСмешаннаяБольшинство продакшен-внедрений >100 камер

Берите только edge, когда: у вас >50 камер с сотовым аплинком, есть требования резидентности данных по GDPR или флот камер в удалённых локациях.

Берите гибрид, когда: у вас 100+ камер и нужны и быстрые алерты на устройстве, и облачная корреляция событий по нескольким камерам. Стандарт 2026 года для продакшена.

Берите только облако, когда: делаете разовый форензик-анализ архивных записей или пилотируете на <30 камерах перед масштабированием.

Берите VLM-расширенный вариант, когда: сценарий открытый («помечайте всё странное») и вы готовы мириться с задержкой облака. GPT-4V или Gemini поверх событий, помеченных на edge, ловят то, что пропускают модели с жёстко закодированными классами.

Применение по вертикалям

Ритейл. Предотвращение потерь (кражи, sweet-hearting на кассе), аналитика покупательского пути (тепловые карты, время пребывания), длина очередей, покрытие персоналом, соблюдение планограммы. Walmart, Target и крупные продуктовые сети используют AI-аналитику более 5 лет; средний сегмент только сейчас её внедряет.

Транспорт и умный город. Транспортные потоки, детекция инцидентов, контроль парковки, общественная безопасность, плотность толпы. Серьёзная нагрузка по соответствию EU AI Act — многие сценарии попадают в категорию «высокого риска».

Стройка. Контроль СИЗ, нарушение зон безопасности, движение техники, проникновение в нерабочее время, отслеживание прогресса. Профильная зона EyeBuild.

Спорт. Трекинг игроков, игровая аналитика, автоматическая генерация хайлайтов для трансляций. Часто пересекается с технологиями вещания.

Расчёт ROI по вертикалям

Предотвращение потерь в ритейле. Среднее годовое усыхание: 1,5–2,5 % от продаж. AI-аналитика обычно сокращает усыхание на 20–30 %. Для сети с выручкой в 3,7 млрд ₽ при усыхании 2 % — это 75 млн ₽ потерь; аналитика снижает их примерно до 52 млн ₽, экономия — около 22 млн ₽. Развёртывание камер и аналитики: 2,2–6 млн ₽. Окупаемость: 4–12 месяцев. ROI за 18 месяцев: 10–15×.

Безопасность на стройке. Снижение страховых премий на 30–50 % при подтверждённом контроле СИЗ. Для площадки с фондом оплаты труда в 750 млн ₽ — это 15 млн ₽ премий; аналитика экономит 4,5–7,5 млн ₽ в год. Плюс меньше задержек проекта из-за инцидентов. Окупаемость: 6–12 месяцев.

Умный город и транспорт. Сокращение времени детекции инцидентов на 60–80 % (с минут до секунд). Сложно посчитать в чистом ROI, но критично для SLA по безопасности и регуляторного соответствия.

Спортивные трансляции. Автоматическая генерация хайлайтов: сокращение редакторских трудозатрат на 30–50 %. Данные трекинга игроков продаются командам и спонсорам как отдельный поток выручки. Сильный кросс-сейл с нашей интерактивной платформой StreamLayer.

Нужен расчёт ROI под вашу вертикаль?

Пришлите количество камер, вертикаль и текущую болевую точку. В течение 48 часов мы вернёмся с одностраничной моделью ROI. Бесплатно.

Позвоните нам → Напишите нам →

Матрица вендоров — Axis, Hanwha, BriefCam, Avigilon, custom

ВендорСильная сторонаСлабая сторонаКогда подходит
Axis CommunicationsКачественные камеры и аналитическая платформа ACAPПремиальная ценаКорпоративная безопасность, ритейл
Hanwha VisionWisenet и edge-аналитика AI BoxR&D-центр в Корее — цикл интеграции медленнееСредний сегмент с бюджетом на премиум
Avigilon (Motorola)Сильный appearance search, платформа ACCПривязка к вендоруОбщественная безопасность, крупный enterprise
BriefCamVIDEO SYNOPSIS — часы записи разбираются за минутыТолько бэкенд; камеры нужны отдельноФорензик-анализ, разбор после события
GenetecSecurity Center и AI-интеграцииТяжёлая платформа, сложное развёртываниеГоссектор, транспорт
Hikvision / DahuaСамые дешёвые камеры, широкий SDKОграничения на федеральном рынке США, опасения по приватности в ЕСЧувствительные к цене рынки без ограничений
Custom (white-label и кастомная прошивка)Полный контроль над IP, модели под вертикальИнженерные инвестицииПродукты в стиле EyeBuild, вертикальный SaaS

Приватность и EU AI Act

Уровни риска по EU AI Act (действуют с 2025 года). Биометрическая идентификация в реальном времени в общественных местах в основном запрещена (с узкими исключениями для правоохранительных органов). Мониторинг рабочих мест, мониторинг в образовании, миграционный и пограничный контроль попадают в категорию «высокого риска» с обязательными требованиями: документация, надзор человека, постмаркет-мониторинг, оценка соответствия.

Статья 9 GDPR. Биометрические данные — включая шаблоны распознавания лиц — относятся к особой категории. Их обработка требует либо явного согласия (что в видеонаблюдении встречается редко), либо отдельного правового основания по статье 9. У большинства внедрений распознавания лиц в видеонаблюдении ЕС юридическая база шаткая; ждите давления со стороны регуляторов.

Великобритания и CCPA. Рекомендации ICO по духу близки к GDPR. CCPA в Калифорнии менее строг к видеонаблюдению как таковому, но в связке со штатными биометрическими законами (BIPA в Иллинойсе, Texas Capture or Use of Biometric Identifier Act) даёт похожий эффект.

Меры защиты. Удаление PII прямо на устройстве (размытие лиц до того, как кадр покинет камеру), минимизация данных (события вместо сырых кадров), ограничения хранения (7–30 дней для сырого видео), явная DPIA, публичные таблички и формы согласия. Для высокорисковых внедрений по EU AI Act нужен партнёр по оценке соответствия.

Как пилотировать AI-видеоаналитику без покупки всего сразу

1. Определите 2–3 результата. «Снизить усыхание», «Детектировать проникновение менее чем за 5 секунд», «Отлавливать нарушения по СИЗ». Пилоты с пятью и более целями проваливаются — измерить всё за 4 недели не получится.

2. Пилотируйте 2–3 вендоров на реальном видео. Демо вендоров идут на идеальных данных. Реальное видео грязное: переменное освещение, перекрытия, погода. Пилот должен идти НА ВАШЕМ видео и в ВАШИХ условиях.

3. Замеряйте precision и recall на размеченной валидационной выборке. Просите каждого вендора предоставить 14-дневные результаты оценки на 200–500 размеченных событиях из вашей среды. Бенчмарки от вендора неперенесимы.

4. Гоняйте 2–4 недели по дню/ночи и будням/выходным. Дрейф проявляется в пилоте, а не на демо. Снимайте метрики в конце, а не в начале.

5. Стоимость интеграции считайте отдельно. Подключите каждого кандидата к вашей VMS и системе оповещений. На уровне флота камер именно стоимость интеграции часто становится решающим фактором.

Build vs buy: фреймворк решения

Покупайте, когда: нужна общая детекция (человек/транспорт/лицо), у вас <500 камер, нет специфичных для вертикали событий, нет требований по соответствию сверх GDPR.

Стройте, когда: нужны доменные события (СИЗ с конкретным снаряжением, спортивный трекинг с распознаванием логотипа команды, контроль планограммы в ритейле), у вас >500 камер и стоимость определяет всё, нужна интеграция кастомного железа (PTZ с собственной прошивкой).

Гибрид: готовые камеры на ингесте плюс собственный аналитический слой на вашей VMS или AI edge-боксе. Самый частый сценарий для среднего сегмента в вертикалях, где встроенная вендорская аналитика слишком общая.

Мини-кейс — сеть ритейла снижает усыхание на 23 %

Американская продуктовая сеть (NDA, 47 магазинов) обратилась к нам в 2024 году с усыханием на уровне 1,9 % от продаж — это около 285 млн ₽ в год. Причины: сочетание внешних краж, sweet-hearting на кассах самообслуживания и потерь на приёмке поставок.

Сборка за 16 недель. Недели 1–3: согласование со стейкхолдерами, выбраны 4 измеримых результата (sweet-hearting на самообслуживании, кражи на выходе, ошибки приёмки, нарушения сотрудниками). Недели 4–6: развёрнуты AI-боксы на Hailo-8 рядом с уже стоящими камерами Axis (без замены камер). Недели 7–10: дообучили кастомный YOLO и трекинг на 6 тысячах размеченных событий из 3 пилотных магазинов. Недели 11–13: раскатка на все 47 магазинов с центральным дашбордом. Недели 14–16: тонкая настройка и обучение операторов.

Результат за 12 месяцев. Усыхание упало с 1,9 % до 1,46 % — относительное снижение на 23 %, годовая экономия около 66 млн ₽. Стоимость внедрения: 23 млн ₽ — железо, ПО, обучение. Окупаемость на пятом месяце. Готовы обсудить аналогичный проект — позвоните или напишите нам.

Фреймворк решения — выберите путь по пяти вопросам

Q1. Какие 2–3 результата вы будете измерять? Без чётких целей выбрать вендора невозможно.

Q2. Edge или гибрид? >100 камер → почти наверняка гибрид. >500 камер на сотовой связи → преимущественно edge.

Q3. Готовая аналитика или кастомная? Общие события → готовая. Специфика вертикали → кастом или дообучение.

Q4. Какова ваша позиция по приватности? Развёртывание в ЕС, биометрия, мониторинг рабочих мест → высокорисковый трек EU AI Act. Закладывайте соответствие с первого дня.

Q5. Интеграция с существующей VMS? Поддержка ONVIF Profile T — базовая планка интеграции; без неё вы строите параллельный стек.

Чего избегать

1. Верить вендорским бенчмаркам. Всегда пилотируйте на ВАШЕМ видео в ВАШИХ условиях. Цифры от вендора — лучший случай в их лаборатории.

2. Пытаться запустить все 8 категорий сразу. Выберите 2–3 с максимальным ROI и расширяйтесь позже.

3. Игнорировать высокорисковую классификацию EU AI Act. Несколько частых сценариев видеонаблюдения (мониторинг рабочих мест, мониторинг в школах) теперь формально регулируются. Дорогой сюрприз посреди внедрения.

4. Забывать про стоимость интеграции. Аналитический слой — это 30 % проекта; интеграция с VMS, оповещениями и автоматизацией процессов — оставшиеся 70 %.

5. Чистое облако на масштабе флота. Тысяча и больше камер на чисто облачном инференсе — ловушка по стоимости. Переходите на гибрид до отметки в 500 камер.

Какие KPI измерять

KPI качества. Precision и recall на размеченной валидации. Доля ложноположительных по отчётам операторов. Задержка детекции p50/p95.

Бизнес-KPI. Те самые 2–3 целевые метрики, заданные на старте (усыхание, время реакции на инцидент, доля соответствия СИЗ). Расчёт ROI за 12 месяцев.

KPI надёжности. Время доступности флота камер, сигнал дрейфа модели, доля успешных OTA-обновлений.

FAQ

Можно ли добавить AI-аналитику к уже стоящим камерам?

Да — поставьте рядом AI-бокс (Hailo-8 / Jetson Orin Nano), заберите RTSP-поток с IP-камеры и запустите инференс на боксе. Частый паттерн, когда заменить камеры по капексу нельзя.

Нужна ли экспертиза в ML, чтобы развернуть систему?

Готовая вендорская аналитика — нет, ML на стороне вендора. Кастомные доменные модели — да, нужен дата-сайентист или партнёр с ML-экспертизой. Дообучение предобученного YOLO — средняя сложность: реально с сильным DevOps и базовыми знаниями ML.

А что насчёт vision-language моделей (GPT-4V, Gemini Vision)?

Отличный вариант для облачной верификации событий, помеченных на edge: «делает ли этот человек что-то подозрительное?». Добавляет задержку (1–3 секунды) и стоимость на кадр; используйте только на отфильтрованных edge-событиях. Тренд 2026: VLM-расширенная аналитика для открытой детекции за пределами фиксированных категорий.

Работает ли AI-видеоаналитика на видео с нагрудных камер?

Да, но угол и характер движения отличаются от стационарных камер — модели, обученные на стационарном видео, требуют дообучения. Существуют отдельные модели под body-cam (Axon AI, Motorola). Регулирование приватности по нагрудным камерам в ряде юрисдикций строже.

Что такое BriefCam VIDEO SYNOPSIS?

Запатентованный приём, который сжимает часы видеонаблюдения в короткую сводку, накладывая объекты из разных временных окон. Оператор просматривает 12 часов записи за 5 минут. Лучшее в классе для форензик-анализа после события.

Камеры Hikvision и Dahua — это проблема?

На федеральном рынке США — да, их блокирует правило FCC. На частном рынке США и в большинстве других регионов они по-прежнему широко стоят. Часть европейских регуляторов высказывают опасения по экспорту данных. К 2026 году большинство корпоративных покупателей предпочитают Axis, Hanwha, Avigilon, чтобы не упираться в эти вопросы.

Сколько занимает развёртывание?

Готовая вендорская аналитика на уже стоящем флоте камер: 4–8 недель. Кастомная аналитика с дообучением модели: 12–20 недель. Установка новых камер плюс аналитика: добавьте 4–8 недель на монтаж. Быстрее, если переиспользовать наши паттерны Agent Engineering из EyeBuild и предыдущих ритейл-проектов.

Как выглядит ROI на 100 камер?

Зависит от вертикали. Ритейл (предотвращение потерь): обычно 15–37 млн ₽ годовой экономии, 6–11 млн ₽ на развёртывание, окупаемость 4–9 месяцев. Стройка (безопасность): 3,7–9 млн ₽ снижения страховых премий плюс неосязаемая ценность от предотвращённых инцидентов. Умный город: трудно посчитать в чистом ROI, но политически весомо.

Edge AI

Edge AI для видеонаблюдения

Глубокий разбор уровней железа и инференса на устройстве.

ML

Алгоритмы детекции аномалий

Разбор аналитики поведения как продолжение этой статьи.

VMS

Интеграция аналитики с VMS

Паттерны интеграции событий аналитики со стороны VMS.

Архитектура

Масштабируемые VMS

VMS под масштаб флота.

AI-инфраструктура

MCP для видеоприложений

Слой LLM-агентов поверх событий аналитики.

Готовы развернуть AI-видеоаналитику, которая окупится?

AI-видеоаналитика 2026 года — зрелая, аппаратно ускоренная и ROI-положительная в ритейле, на стройке, в транспорте и спорте. Возьмите 2–3 целевых результата на вертикаль, пилотируйте на реальном видео, замеряйте на размеченной валидации и интегрируйтесь с VMS через ONVIF Profile T. Высокорисковая классификация по EU AI Act имеет значение — закладывайте соответствие с первого дня.

Гибрид edge+облако — стандарт для продакшена. Встроенная вендорская аналитика работает для общих событий; кастом — для специфики вертикали и защиты ниши. Стоимость интеграции — это 70 % проекта, планируйте бюджет соответственно.

Хотите план запуска аналитики за 16 недель?

Пришлите состав флота камер и целевые результаты. В течение 48 часов мы вернёмся с архитектурой, матрицей вендоров и прогнозом ROI. Бесплатно.

Позвоните нам → Напишите нам →

  • Технологии