AI-видеоаналитика: полный гид по умным системам безопасности в 2026 году

AI-видеоаналитика: исчерпывающий гид по умным системам безопасности в 2026 году — обложка

Камера видеонаблюдения, которая просто записывает, — это всего лишь видеорегистратор. Камера, которая понимает, что она видит, — которая распознаёт драку ещё до первого удара, замечает погрузчик, выехавший на пешеходную дорожку, и фиксирует номер автомобиля, час кружащего по парковке, — это уже система безопасности. Закрыть этот разрыв — задача AI-видеоаналитики, и в 2026 году это уже не научная фантастика, а строка в бюджете, которую совет директоров рассчитывает увидеть.

Этот гид — именно та шпаргалка, которую мы сами хотели бы получить девять лет назад, когда запускали свой первый продукт по AI-безопасности на видео. Здесь объясняем, что такое AI-видеоаналитика для безопасности в 2026 году, восемь сценариев, в которых она действительно окупается, семислойную архитектуру, которую мы используем в продакшене, семь платформ умной безопасности, между которыми стоит выбирать, регуляторную картину (NDAA, EU AI Act, GDPR, BIPA), реальную финансовую модель для развёртывания на 200 камер, а также подводные камни, которые тихо губят такие проекты. Текст длинный. Но практичный. Пишем его для директоров по безопасности, руководителей ИТ/OT и продакт-менеджеров, которым нужно принять решение уже в этом квартале.

Главное

Мировой рынок видеоаналитики в 2026 году достигнет примерно 510 млрд ₽, а среднегодовой рост в 22–30% позволит ему превысить 3,6 трлн ₽ к 2035 году.
Современные детекторы (YOLOv9-Е, YOLOv10) показывают 56% mAP на COCO и работают в 1,8 раза быстрее, чем RT-DETR — аналитика в реальном времени на Jetson за 15 000₽ стала нормой, а не исключением.
Потери розницы достигли 8,4 трлн ₽ в 2025 году; кейсы внедрения ИИ для предотвращения потерь показывают снижение краж на 30–83% за двенадцать месяцев.
Запреты EU AI Act действуют с февраля 2025; обязательства для систем высокого риска вступают в силу в августе 2026. Раздел 889 закона NDAA уже запрещает использование продукции Hikvision и Dahua в федеральных контрактах.
Edge-инференс сокращает трафик на 80–95% и стал стандартом для любого внедрения от 50 камер — теперь облако используется только для повторного поиска, федеративного обучения и аудита.

01. Почему этот гид написала Фора Софт

Мы разрабатываем AI-видеосистемы с 2017 года, а решения для видеостриминга — в продакшене с 2005. Это даёт нам уникальное понимание умной безопасности: мы наблюдали, как она прошла путь от криминалистического анализа (отмотать запись вчерашнего дня, чтобы найти нарушителя) до принятия решений в реальном времени (предупредить охранника, пока нарушитель ещё не добрался до двери). Большинство наших знаний мы получили, выпуская продукты, которые ломались в продакшене, а потом чинились в субботу в два часа ночи.

Несколько продуктов, на которых основан этот гид:

MindBox — платформа для обнаружения инцидентов, которая обрабатывает более 500 000 автомобилей в день на 80+ камерных площадках, с точностью распознавания лиц 99,5% и оповещениями за менее чем секунду.
V. A. L. T. — многозальная платформа видеозаписи, развёрнутая в 770+ организациях с 2 500+ камерами; используется для обеспечения безопасности, контроля и фиксации комплаенс-данных.
Системы детекции СИЗ для промышленности — распознавание касок, жилетов и контроль запрещённых зон, внедрённые на стройках и энергетических объектах.
Пилоты по предотвращению потерь в рознице — выявление схемы swap-scan (sweethearting), распознавание паттернов ORC и контроль касс самообслуживания.

Две оговорки о том, чем этот гид отличается от маркетинговых PDF, которые легко найти в интернете. Во-первых, у нас есть личная заинтересованность — всё, что здесь написано, мы либо используем сами, либо строим для платящих клиентов. Во-вторых, наша практика Agent Engineering позволяет нам выполнять такие проекты на 30–50% быстрее, чем традиционная студия: мы применяем ИИ для написания шаблонного кода, генерации тестовых фикстур, создания черновиков ONVIF-интеграций и так далее. Из-за этого наши оценки часто кажутся подозрительно низкими. Но это не так. Они просто точные.

Не хочется читать? Позвоните или напишите нам — CTO проанализирует ваш парк камер, VMS и регуляторные ограничения и подскажет, что реально можно сделать. Контакты ниже.

02. Что такое AI-видеоаналитика для безопасности на самом деле

AI-видеоаналитика — это слой, который превращает сырые видеокадры в структурированные события: «человек пересёк линию в 14:32:08, уверенность 0,94». На основе этих событий работают другие системы: VMS, контроллер доступа, ситуационный центр, мобильное приложение. Для задач безопасности используются семь аналитических примитивов: детекция объектов, мультиобъектный трекинг, повторная идентификация человека, классификация действий и поведения, распознавание лиц, распознавание автомобильных номеров и детекция аномалий. Каждый примитив — это отдельная модель. У каждой модели есть задержка, точность, требования к оборудованию и регуляторные аспекты.

Это не: детектор движения (технология из 1990-х, срабатывающая на качающиеся ветки), универсальный ChatGPT-поверх-видео (задержка и стоимость не подходят для реального мониторинга) и не «умные камеры» с проприетарной прошивкой, которые запирают вас в экосистему одного вендора (на третий год об этом пожалеете).

Полезная мысленная модель: AI-аналитика для безопасности добавляет над камерой три новых слоя — восприятие (что в кадре), понимание (что происходит между кадрами) и действие (что с этим делать). Большинство готовых решений хорошо справляются с восприятием, частично — с пониманием, а за действия почти полностью отвечают вы. Именно этот последний слой решает, станет ли проект успешным или останется безрезультатным.

03. Состояние рынка: куда идут инвестиции в умную безопасность в 2026

Цифры в целом совпадают. Разные аналитики до сих пор называют разные абсолютные значения (мировой сегмент «видеоаналитики» колеблется от 375 до 825 млрд ₽ — в зависимости от того, включают ли распознавание лиц, ALPR и анализ трафика), но форма рынка у всех одна: рост на 22–30% в год до конца десятилетия, причём основная часть новых инвестиций идёт в AI-аналитику, а не в традиционные VMS и хранение.

Несколько цифр, которые стоит запомнить:

Мировой рынок видеоаналитики: около 510 млрд ₽ в 2026 году, прогноз — более 3,6 трлн ₽ к 2035 году.
Поставки edge-камер с поддержкой ИИ: по прогнозам, к 2027 году превысят 120 миллионов штук в год, когда Jetson Orin и Hailo-8 опустятся ниже порога в 6 000 ₽ за BOM.
Потери розницы в США: 8,4 трлн ₽ в 2025 году, причём на внешние кражи и организованную преступность приходится около 36% потерь.
Средняя конверсия AI-пилотов в продакшен: пока всего около 30% в сфере физической безопасности, проекты в основном застревают на интеграции с устаревшими системами видеонаблюдения и из-за усталости от ложных оповещений.
Действие NDAA Section 889: федеральные контракты больше не могут использовать оборудование Hikvision, Dahua, Hytera, Huawei и ZTE — и это правило начинает распространяться на закупки штатов и частных компаний.

Если вы планируете бюджет на 2026 год, практический вывод такой: железо стало максимально дешёвым, модели становятся одинаковыми, а главное отличие — в интеграции. Акцент сместился с «купить аналитику» на «встроить аналитику в реальные рабочие процессы».

04. Восемь сценариев, где аналитика на основе ИИ окупается в сфере безопасности

Избавим вас от рекламной фразы «возможности безграничны». По нашему опыту работы с проектами, восемь основных сценариев покрывают около 90% всего, что доходит до продакшена. Они упорядочены по степени зрелости: чем выше в списке, тем больше шансов найти готовые решения, которые работают «из коробки».

1. Розница: предотвращение потерь и ORC

Sweethearting на кассах самообслуживания, распознавание паттернов организованной розничной преступности (ORC), проникновение после закрытия. Искусственный интеллект выявляет skip-сканирование (товар провезён мимо сканера без сигнала), аномалии при упаковке (товар положили в пакет, не отсканировав) и возврат известных нарушителей. Снижение потерь по реальным внедрениям: 30–83% за двенадцать месяцев.

2. Общественная безопасность и умные города

ALPR для оповещений об угнанных автомобилях, оценка плотности толпы, обнаружение оружия на площадях, распознавание драк на транспортных узлах. Правовая рамка ограничена (особенно в ЕС — статья AI Act о «биометрической идентификации в реальном времени в общественных местах»), поэтому большинство систем в продакшене работают либо с явным согласием пользователей, либо ограничиваются криминалистическим анализом, а не живыми оповещениями.

3. Транспорт и парковки

Детекция движения против потока на трассах, проезд под шлагбаумом «паровозиком», классификация припаркованных автомобилей, поиск оставленного багажа в аэропортах. Источник видео — обычно PTZ-камеры и ANPR-камеры на уровне полос. MindBox обрабатывает более 500 000 автомобилей в день в этом сегменте.

4. Промышленность: СИЗ и охрана труда

Детекция касок, сигнальных жилетов, защитных очков и страховочных привязей на стройках, НПЗ и складах. Плюс контроль зон запрета (никого в радиусе разворота экскаватора) и оповещения о сближении погрузчиков с пешеходами.

5. Медицинские учреждения

Детекция падений пациентов, контроль ухода (пациент-странник покидает отделение), эскалация агрессии в приёмном покое. HIPAA требует строгого on-prem-инференса и плотного журналирования доступа — чисто облачные решения обычно не проходят сразу.

6. Школы и университеты

Детекция оружия на периметре и у входов, автоматизация локдауна, обнаружение проникновений после закрытия. Этот рынок крайне чувствителен к ложным срабатываниям: одно ложное оповещение об оружии, вызвавшее спецназ, может стоить администратору карьеры. Поэтому вендоры обычно направляют оповещения на проверку оператору в круглосуточном SOC.

7. Госсектор и критическая инфраструктура

Периметры подстанций, водоочистные сооружения, порты. Используются только камеры, совместимые с NDAA (Axis, Hanwha, Bosch, i-PRO, Verkada). Большинство систем изолированы от интернета и передают данные в SIEM через односторонние data diode.

8. Стройка и контроль прогресса работ

Подсчёт поступающих материалов, анализ простоев техники, кражи после окончания смены, несанкционированный доступ на территорию. Часто устанавливается как временная мачтовая камера с сотовым каналом; аналитика работает на небольшом Jetson-устройстве у основания мачты.

Build vs buy: решение

Застряли между готовой VMS и собственной платформой? Мы делали и то, и другое — десятки раз. 30 минут разговора с нашим CTO помогут понять, на какой стороне границы ваш проект.

Позвоните нам → Напишите нам →

05. Эталонная архитектура: семь уровней пайплайна аналитики безопасности

Все системы умной безопасности, которые мы выпускаем, устроены примерно одинаково. Семь слоёв ниже — то, что мы создаём или интегрируем почти в каждом проекте. Пропустите любой — и он, скорее всего, подведёт в продакшене.

Слой 1. Камеры и приём потока

Камеры с поддержкой ONVIF Profile S/Т/G, транслирующие RTSP (H.264/Н.265) на медиасервер. Для новых проектов рекомендуем использовать бренды, совместимые с NDAA (Axis, Hanwha, Bosch, i-PRO), с разрешением не ниже 4 Мп, частотой кадров 30 fps и поддержкой WDR. Не полагайтесь на встроенную аналитику камеры, если задача сложнее простого определения «движение / нет движения» — модель должна работать на устройстве, которым вы управляете.

Слой 2. Edge-узел инференса

Небольшой Jetson Orin (Nano/NX/AGX) или комбинация Intel + Hailo-8 в серверной шкафу на этаже обрабатывают 8–32 потока. Запускают YOLOv9/10 для распознавания объектов, ByteTrack или BoT-SORT для отслеживания и квантованную модель для распознавания лиц или ALPR при необходимости. Отправляют структурированные события через MQTT или gRPC на серверный уровень.

Слой 3. Серверный уровень

NVIDIA Triton + TensorRT используются для всех моделей, слишком тяжёлых для edge-устройств (например, повторная идентификация объектов между камерами, сложное распознавание действий). На том же уровне работает rules engine, который собирает события в реальные оповещения: «человек + длительное стояние более 60 секунд + после закрытия = тревога».

Слой 4. Данные и индекс

PostgreSQL/TimescaleDB для событий, S3-совместимое объектное хранилище (MinIO или AWS S3) для клипов и векторная БД (Qdrant или Weaviate) для поиска похожих случаев — «найди все клипы с человеком в красной куртке между 18:00 и 20:00».

Слой 5. Интеграция с VMS

Отправка детекций обратно в Milestone XProtect, Genetec Security Center, Avigilon Control Center или Hanwha Wisenet через их SDK. Именно здесь большинство проектов недооценивают объём работы: SDK вендоров часто плохо документированы и требуют большого количества связующего кода.

Слой 6. Оповещения и рабочие процессы

Дашборд SOC, мобильное приложение, интеграции с PagerDuty/Opsgenie, двусторонние рации диспетчера и панели контроля доступа (HID Origo, LenelS2, Genetec Synergis). Именно этот интерфейс пользователь видит каждый день — закладывайте на него бюджет соответственно.

Слой 7. Аудит и управление

Защищённые от подделки журналы для каждой детекции, каждого переопределения и каждого открытия клипа. RBAC и SSO на уровне оператора. Политики хранения, привязанные к местному законодательству о персональных данных — обычно 14–90 дней для необработанного видео и дольше — для размеченных событий.

Где команды экономят и допускают ошибки: слой 6 (оповещения) и слой 7 (аудит). Пропустив аудит, рискуете попасть в аварийный режим при проверке GDPR или CJIS; если не настроить оповещения — SOC быстро утонет в потоке ложных срабатываний.

06. Сравнительная матрица: семь платформ умной безопасности

Если вы выбираете готовое решение, практичный шорт-лист на 2026 год выглядит так. Цены указаны ориентировочно — все вендоры активно снижают стоимость при долгосрочных контрактах, поэтому воспринимайте их как ориентиры, а не точные котировки.

Платформа	Кому подходит	Edge или cloud	Ориентир по цене	На что обратить внимание
Verkada	Средний корпоративный сегмент; SMB с единой физической безопасностью	Edge-first, облачное управление	37 500–225 000 ₽ за камеру + 14 900–134 900 ₽ в год	Замкнутая экосистема оборудования; экспорт данных затруднён
Avigilon (Motorola)	Крупный enterprise; поиск по внешнему виду	Гибрид (сервер + edge)	По запросу; ~52 500–112 500 ₽ за камеру + лицензия ACC	Поканальная лицензия быстро расходуется
Genetec Security Center	Госсектор, транспорт, крупные кампусы	On-prem + облачные надстройки	По запросу; только через партнёрский канал	Крутая кривая обучения; много интеграций
Rhombus	Мультисайтовый SMB; cloud-нативный	Edge + облако	~52 500–105 000 ₽ за камеру + 15 000–37 500 ₽ в год	Меньше интеграций, чем у Verkada
Eagle Eye Networks	Облачная VMS поверх существующих камер	Cloud-first через локальный мост	1 125–3 750 ₽ за камеру в месяц + железо моста	Прожорлив к трафику; задержка нестабильна
Spot AI	AI поверх существующего парка камер	On-prem-устройство + облако	~3 750–7 500 ₽ за камеру в месяц со всем	Молодая экосистема; мало готовых интеграций
Кастомная разработка (Фора Софт и подобные)	Всё, что не влезает в SKU; продуктовые платформы	Решайте вы	6–30 млн ₽ за MVP, далее — предельная цена за камеру	Нужен настоящий инженерный партнёр

Цены отражают публично доступные диапазоны на I квартал 2026 года и регулярно меняются из-за скидок, долгосрочных контрактов и пакетных предложений. Воспринимайте эту колонку как ориентир, а не как коммерческое предложение.

Совет по закупке: попросите поставщика письменно подтвердить цену на камеру на 2–5 год. Ежегодное повышение на 8–15% — распространённая практика, и о ней редко упоминают на первой встрече.

07. Edge vs cloud: где запускать инференс

Для любого внедрения от 50 камер edge-инференс сегодня — стандарт по умолчанию. Аргументы банальные, но решающие: трафик, задержка, стоимость.

Параметр	Edge (Jetson / Hailo)	Cloud (T4 / L4 / A10G)
Задержка детекции	30–80 мс	200–800 мс (туда-обратно)
Трафик на камеру	~10–50 кбит/с (только события)	2–8 Мбит/с (полный поток)
Что будет, если WAN ляжет	Продолжает обнаруживать локально	Слепнет
CapEx на узел с 8 камерами	112 500–225 000 ₽	~0 ₽ предоплаты
OpEx на камеру в месяц	~150–450 ₽ (питание + обслуживание)	~1 125–3 000 ₽ (вычисления + трафик)
Приватность	Кадры не покидают объект	Кадры уходят за периметр сети
Где лучше	Живые оповещения, >50 камер, регуляторика	Криминалистический поиск, переобучение моделей, <20 камер

Наша устойчивая рекомендация — edge для живых оповещений, облако для криминалистики и обучения.

08. Слой моделей: что реально можно запускать на ваших камерах

Модели быстро устаревают, но в начале 2026 года практичный шорт-лист для задач в продакшене в области безопасности остаётся небольшим. Вот что мы используем и в каких случаях:

Детекция: YOLOv9-Е (56% mAP на COCO) — когда важна точность; YOLOv10-S (43,8% mAP, в 1,8 раза быстрее RT-DETR) — для edge-устройств. RT-DETR — для задач на трансформерах.
Трекинг: ByteTrack и BoT-SORT — для общих задач; DeepSORT — только если нужна идентификация объектов внутри системы.
Повторная идентификация: OSNet или CLIP-ReID для отслеживания объектов между камерами. Векторная база данных (Qdrant/Weaviate) для хранения галереи.
Распознавание действий: SlowFast или VideoMAE для драк, падений, длительного стояния. Это тяжёлые модели — обычно работают на сервере, а не на устройстве.
Обнаружение аномалий: автоэнкодеры с памятью для неразмеченных сцен.
Распознавание лиц: эмбеддинги ArcFace / AdaFace, индекс FAISS или Qdrant. Потолок качества обычно определяется не моделью, а качеством съёмки.
ALPR: отдельный пайплайн (детектор + распознавание номера). Открытый стек: PaddleOCR + собственный детектор. Коммерческие решения: Plate Recognizer, Genetec AutoVu.

09. Интеграция с VMS: как подключить аналитику к существующему стеку

В greenfield-проекте VMS выбираете вы. Почти в каждом brownfield-проекте — а таких большинство — ИИ подключают к уже работающей системе. Большую часть рынка по-прежнему занимают четыре основных платформы: Milestone XProtect, Genetec Security Center, Avigilon Control Center и Hanwha Wisenet WAVE. У каждой есть SDK или REST API для отправки событий обратно; у каждой — свои особенности; для некоторых сценариев требуется платное партнёрство по интеграции.

Типичные паттерны интеграции, которые мы используем: запись обнаруженных событий как закладок (Milestone), как тревог (Genetec), как векторов для поиска по внешности (Avigilon) или как оверлей-метаданных (Hanwha). Выбор влияет на то, как оператор работает с оповещением: закладки удобны для анализа, тревоги требуют подтверждения, а оверлеи отображаются прямо на видеостене в реальном времени.

Бюджетное правило: интеграция с VMS обычно занимает 20–35% проекта по времени. Недооценка этой части — самая частая причина срыва сроков.

10. Пайплайн оповещений: как превратить обнаружения в действия

Детекция — это не оповещение. Детекция — это сигнал, который при наличии контекста, rules engine и внимания оператора может превратиться в тревогу. Ошибитесь на этом этапе — и заказчик отключит систему через месяц, потому что SOC будет тонуть в шуме.

Несколько паттернов, которые работают в продакшене:

Складывайте, а не сцепляйте. Детекция «человек» после рабочего времени сама по себе не имеет смысла; «человек + ограниченная зона + после рабочего времени + задержка > 30 с» — уже повод для тревоги. Используйте небольшой движок правил (Drools, Open Policy Agent или собственный).
Тиерируйте реакцию. Критично → звоните дежурному охраннику. Серьёзно → алерт на дашборде SOC + таймер на подтверждение. Малозначимо → в журнал для аудита, разбираем при пересменке.
Фидбек по ложным срабатываниям — в один клик. Оператор должен пометить ложное срабатывание за две секунды — именно такие данные потом становятся основой для дообучения.
Всегда показывайте клип. Ни одно оповещение не отправляется без 10-секундного превью. Операторы не доверяют «голым» алертам — и это правильно.

11. Соответствие нормам: NDAA, EU AI Act, GDPR, HIPAA, BIPA

Регуляторика из «о, ещё надо проверить» превратилась в первый рубеж закупки. Вот картина на 2026 год — перед запуском поговорите с настоящим юристом, но эта таблица убережёт от очевидных ловушек.

Регуляторный режим	Где применяется	Практическое влияние
NDAA Section 889	Федеральные контракты США распространяются на штаты и корпорации	Никаких Hikvision, Dahua, Hytera, Huawei, ZTE — вплоть до уровня компонентов
EU AI Act	Всё, что продаётся или используется в ЕС	Биометрическая идентификация в реальном времени в публичных местах запрещена (с февраля 2025); требования к системам высокого риска вступают в силу с августа 2026
GDPR	Данные жителей ЕС, где бы они ни обрабатывались	DPIA для видеоаналитики обязателен; правовое основание — обычно законный интерес и информационные таблички
HIPAA	Здравоохранение в США	PHI на видео — защищаемые данные; нужен on-prem-инференс, BAA и журналы аудита
BIPA	Иллинойс (и аналогичные законы в Техасе и Вашингтоне)	Письменное согласие на биометрию — коллективные иски реальны
CJIS	Данные правоохранительных органов США	Проверка персонала, шифрование, удобство on-prem
SOC 2 Type II	Корпоративные клиенты	Всё чаще обязательна гигиена; закладывайте 6–9 месяцев до первого отчёта

12. Мини-кейс: как MindBox достигает 99,5% точности распознавания лиц на 500 000 автомобилей в день

MindBox — одно из наших ключевых внедрений в области аналитики безопасности и яркий пример реальной работы в продакшене масштабного уровня. Пять факторов делают его эффективным:

Edge-first приём потока. На каждом шлагбауме или в зоне установлен Jetson AGX Orin, который выполняет локальную детекцию, трекинг и распознавание номеров (ALPR). На сервер отправляются только структурированные события.
Захват лиц с контролем качества. Лица кодируются, только если классификатор качества поставил оценку выше 0,85 — именно это обеспечивает точность 99,5% на действительно важных кейсах.
Тиерированные списки наблюдения. Три уровня (BOLO, человек интереса, заблокированные) с разной политикой оповещений и требованиями к аудиту.
Задержка оповещения меньше секунды. От пересечения лицом линии до звонка дежурному офицеру — менее 800 мс p95.
Цикл обратной связи от оператора. Каждое ложное срабатывание можно пометить одним кликом; модель дообучается на исправленных данных раз в неделю.

Принцип переносится. Тот же подход мы применяем в рознице (вместо «лица» выступает событие sweethearting), в промышленности (нарушение СИЗ) и в здравоохранении (уход пациента). Меняется бизнес-логика, а архитектурный паттерн остаётся прежним.

13. Финансовая модель: оценка проекта на 200 камер «под ключ»

Развёртывание на 200 камер по нескольким объектам — удобная точка для сравнения: именно здесь стоимость SaaS и кастомной разработки выравнивается. Ниже — репрезентативные итоги за первый год, разделённые между готовым решением и кастомной сборкой от нашей команды.

Статья	Коробка (уровня Verkada)	Кастом (уровня Фора Софт)
Камеры (20 шт., совместимые с NDAA)	22 млн ₽ (в пакете)	12 млн ₽ (Axis/Hanwha)
Edge-узлы (25 шт. по 8 камер)	включено	4,5 млн ₽ (Jetson AGX Orin)
Серверный уровень (2 GPU-узла)	облако (внутри подписки)	2,2 млн ₽
Софт / разработка	включено	10–16 млн ₽ (с Agent Engineering)
Подписка за первый год	9–18 млн ₽	~1,1 млн ₽ облачный OpEx
Монтаж и пусконаладка	4,5–9 млн ₽	4,5–7,5 млн ₽
Итог за первый год	36–49 млн ₽	34–46 млн ₽
Со 2-го по 5-й год OpEx (в год)	9–18 млн ₽ регулярно	2,2–4,5 млн ₽ (хостинг + поддержка)

Кастомная сборка по итогам первого года выглядит похоже, но уже со второго года резко вырывается вперёд: вы перестаёте платить SaaS-подписку за каждую камеру. Подвох в том, что эксплуатацию, обновления и поддержку моделей вы (или ваш партнёр) берёте на себя. Это настоящая ответственность. Если в штате нет нужных специалистов — коробочное решение будет правильным выбором.

Сделаем оценку под вас

За 30 минут разберём ваш проект по этой модели — количество камер, площадки, VMS, нормативные требования — и пришлём одностраничную оценку в течение двух рабочих дней.

Позвоните нам → Напишите нам →

14. Фреймворк решений: выбор подхода к безопасности ИИ за пять вопросов

Когда заказчики приходят без чёткого выбора, мы задаём им пять ключевых вопросов. Честные ответы обычно однозначно указывают на один из трёх вариантов: SaaS-платформа, гибрид (существующие камеры + AI-надстройка) или кастомная разработка.

Сколько камер и сколько площадок? Меньше 50 камер или 1–2 площадки → SaaS почти всегда выгоднее. Больше 200 камер или 10+ площадок → кастомное решение быстро становится конкурентоспособным.
Какой у вас парк камер? В основном Hikvision/Dahua, а заказчик — госсектор? Сначала решите вопрос с NDAA. В основном Axis/Hanwha? Можно добавить ИИ через Spot AI или кастомизировать.
Какой сценарий с самым высоким риском? Детекция оружия в школе? Нужен вендор с круглосуточным SOC и человеком в петле. СИЗ на стройке? Подойдут и коробка, и кастом.
Какой у вас регуляторный режим? ЕС + биометрия → риски по AI Act; здравоохранение США → HIPAA on-prem; розница в нескольких штатах с биометрией → угроза по BIPA. Эти ограничения сильно сужают выбор вендора и архитектуры.
Вы продаёте это как продукт или используете внутри? Если создаёте продукт (например, VSaaS-платформу для парковочной отрасли), почти всегда нужен кастом: стандартное решение не даст вам конкурентного преимущества.

Правило для пилотов: настаивайте на четырёхнедельном тестировании на ваших камерах, а не на демо-ролике от вендора. Любой вендор, который отказывается работать с реальными данными, скрывает, как его модели ведут себя вне отрепетированных сценариев.

15. Подводные камни — шесть самых частых ошибок

Считать камеру продуктом. Камера — худшее место для инвестиций в ИИ. Вкладывайте в дашборд SOC, логику оповещений и удобство работы оператора. Камеры меняют раз в 5–7 лет, аналитику — раз в 18 месяцев.
Пропустить дизайн уровней оповещений. Самый быстрый способ загубить внедрение — отправлять каждую детекцию на дашборд SOC. Распределите тревоги по уровням до релиза.
Использовать потребительские камеры. Нет, камера Wyze в чулане — это не камера для безопасности. ONVIF, WDR и поддержка обновлений прошивки — вещи, без которых не обойтись.
Отсутствие цикла дообучения. Модели дрейфуют — новый свет, новая униформа, новые типы машин. Без обратной связи от SOC в обучающую выборку точность постепенно снизится за 6–12 месяцев.
Забыть про аудит-журналы. Когда придёт регулятор (или иск), вопрос будет не «обнаруживала ли система», а «кто и когда смотрел этот клип». Стройте аудит-цепочку с первого дня.
Недооценить время на интеграцию VMS. Закладывайте 20–35% общего объёма работ проекта только на работу с VMS. SDK вендоров редко документированы так подробно, как указано в datasheet’ах.

16. KPI: что измерять и какие целевые значения важны

Короткий список метрик, которые мы отслеживаем при каждом внедрении, с типичными целевыми значениями:

Доля истинно положительных (recall) по сценарию: >85% для критичных к безопасности (оружие, падения); >75% для предотвращения потерь.
Ложные срабатывания на камеру в день: <3 для оповещений, которые мониторит SOC.
Задержка оповещения end-to-end p95: <1,5 с для активных тревог; <5 с допустимо для криминалистики.
Время доступности системы: 99,9% для пайплайна оповещений; 99,5% для аналитических воркеров.
Время до клипа: от сигнала тревоги до просмотра видео — <3 с.
Время подтверждения оператором: p50 < 30 с; p95 < 2 мин.
Дрейф модели: просадка менее чем на 5 процентных пунктов mAP за 6 месяцев.

17. Приватность по умолчанию: как заслужить доверие людей на видео

Privacy by design больше не формальность — это вопрос закупок и интерес инвесторов. На практике это означает:

По умолчанию — эмбеддинги, а не картинки. Когда отправляете данные в векторную БД или в оповещение, передавайте хэш или эмбеддинг, а не исходный кроп лица — везде, где это возможно.
Пайплайн пикселизации для разбора. При открытии клипа оператор по умолчанию видит размытых случайных людей; снятие размытия — журналируемое действие.
Жёсткие сроки хранения по умолчанию. 14 дней для сырого видео, 90 дней для размеченных событий, 7 лет для аудит-журналов — защищаемая база. Разрешите переопределение на уровне объекта.
Запросы субъекта данных — через интерфейс. Если ваша организация подпадает под GDPR, создайте внутренний инструмент для обработки запросов на доступ к данным (SAR) в течение 72 часов. Обработка таких запросов вручную быстро выжигает DPO.
Публичные таблички со ссылкой на политику. Перестраховка, но ожидаемая.

18. Когда не стоит внедрять AI-видеоаналитику прямо сейчас

Короткий список ситуаций, когда наш честный ответ — «подождите полгода, сделайте сначала другое».

У вас нет SOC или чёткой системы эскалации. Обнаружение без действий — это просто шум.
Существующее видео непригодно (плохие ракурсы, низкое разрешение, заслонённые объективы). Сначала разберитесь с оптикой, потом с ИИ.
Вы не проработали правовой режим. Особенно в ЕС: ошибка в DPIA обойдётся дороже всего проекта.
Операторы SOC уже работают на пределе из-за большого количества оповещений. Использование ИИ без продуманной настройки тревог только увеличит шум.
Задача решается датчиком за 3 750 ₽ (геркон на двери, СВЧ-датчик движения). AI здесь — стрельба из пушки по воробьям.

19. Защита системы: что заложить с самого начала

Платформы умной безопасности сами по себе — привлекательная цель: атакующий, получивший доступ к камерам, получает полную картину наблюдения. Что мы закладываем в первый день:

Взаимная аутентификация по TLS между камерами, edge-узлами и серверным уровнем. Открытый RTSP в локальной сети не используется.
Сертификаты на каждое устройство (а не общие ключи), чтобы отзыв украденной камеры не требовал перевыпуска ключей для всего парка.
SSO + RBAC для операторов, аппаратный MFA для административных действий.
Сегментация сети: VLAN камер, VLAN аналитики, VLAN операций. Между ними — файрвол.
Защищённые от подделки журналы (только дозапись, хэш-цепочка), чтобы атакующий не мог удалить следы.
Квартальный red team против дашборда SOC и пайплайна оповещений. Особенно кнопки «приглушить тревогу».
Патчинг прошивок камер как отслеживаемая операционная задача — не «когда-нибудь дойдём».

20. Что дальше: три сдвига 2026–2027, к которым стоит готовиться

VLM-усиленный разбор. Vision-language-модели (Gemini, GPT-4o-уровня) суммируют часы записи на естественном языке. Применять их для оперативных оповещений пока рано — из-за задержек и ошибок, но в криминалистике и при передаче смены это настоящий прорыв.
Дообучение на самом устройстве. Федеративное обучение между edge-узлами: каждая площадка улучшает свою модель, не отправляя пиксели в облако. GDPR и HIPAA соблюдены.
Удешевление камер давит на SaaS-аналитику. Когда NDAA-совместимая Hanwha за 15 000 ₽ в связке с edge-узлом за 22 500 ₽ дают тот же результат, что в 2024 году обеспечивала смарт-камера за 150 000 ₽, поканальная модель SaaS-ценообразования теряет смысл. Ждём консолидации.

21. FAQ

Насколько точна AI-видеоаналитика в 2026 году?

Для детекции объектов на наборе данных COCO топовые открытые модели (YOLOv9-Е, RT-DETR-Х) показывают 56% mAP. В реальных условиях точность распознавания критичных для безопасности событий, настроенная под конкретную сцену, составляет 90–95% при менее чем трёх ложных срабатываниях на камеру в день — при грамотной настройке оповещений.

Можно ли добавить AI-аналитику к уже имеющемуся парку камер?

Да — если камеры поддерживают ONVIF и снимают минимум 2 Мп при 15 кадрах в секунду, можно подключить аналитику через локальное устройство (Spot AI, Camio или собственный уровень на Jetson). Бренды из списка NDAA — отдельный вопрос для федеральных заказчиков.

Законно ли распознавание лиц в моей юрисдикции?

По-разному. EU AI Act запрещает биометрическую идентификацию в реальном времени в публичных местах с узкими исключениями; в США федерального запрета нет, но законы штатов (Illinois BIPA, Texas, Washington) требуют информированного согласия. Перед запуском настоятельно рекомендуем получить письменное юридическое заключение.

Edge или cloud — что выбрать?

Edge — для оперативных оповещений, облако — для анализа и обучения моделей. При 50 и более камерах математика трафика и задержек делает edge-решение стандартом. До 20 камер чисто облачное решение часто проще и дешевле.

Сколько обычно длится внедрение?

Для проекта на 200 камер по нескольким площадкам: 12–20 недель на стандартное развёртывание, 16–24 недели на кастомную сборку с нашей практикой Agent Engineering (против 24–36 у традиционной студии). От пилота до получения первого сигнала — обычно 3–5 недель.

Что именно запрещает NDAA Section 889?

Использование, продажа и интеграция оборудования Hikvision, Dahua, Hytera, Huawei и ZTE в федеральных контрактах — вплоть до уровня компонентов. Закупки штатов и корпораций всё чаще следуют этому правилу.

Может ли ИИ предотвращать кражи в магазине в реальном времени?

Он умеет распознавать — sweethearting, skip-сканирование, паттерны ORC — в реальном времени и вызывать охранника по предотвращению потерь за секунду. «Предотвращает» ли он — зависит от того, как ваш магазин реагирует, и от местного закона о вмешательстве.

Чем видеонаблюдение отличается от видеоаналитики?

Наблюдение — это слой записи (камеры + VMS + хранилище). Аналитика — интеллектуальный слой, который анализирует видео: распознаёт объекты, определяет поведение, генерирует события. Современные системы объединяют оба.

22. Что почитать дальше

Гид по интеграции

Как интегрировать AI-видеоаналитику с существующим стеком видеонаблюдения

Точки расширения VMS, особенности SDK и паттерны интеграции, которые работают в продакшене.

Модели

Модели детекции аномалий для видеонаблюдения

Автоэнкодеры с памятью, модели нормальности и что реально работает на боевом CCTV.

Регуляторика

AI-видеонаблюдение и этика в 2026 году

Обязательства EU AI Act для систем высокого риска, BIPA и как сохранить рассудок DPO.

Розница

Видеоаналитика в рознице: от потерь до конверсии

Детекция sweethearting, аналитика очередей и плейбук, по которому работают наши розничные клиенты.

Подводя итог

AI-видеоаналитика для безопасности в 2026 году — уже не исследовательский проект, а полноценная категория закупок. Оборудование стало дешёвым, открытые модели — качественными, а регуляторная среда созрела настолько, что под неё можно планировать внедрение. Остаётся работа: интеграция, настройка оповещений и соблюдение операционной дисциплины. Именно здесь проекты либо успешно запускаются, либо тихо проваливаются.

Если вы оцениваете проект AI-аналитики безопасности — с нуля или на базе существующей инфраструктуры — мы с радостью поможем рассчитать объёмы. Мы разрабатываем такие системы с 2017 года и накопили достаточный опыт.

Готовы обсудить проект?

Поговорите с нашим CTO — 30 минут, без слайдов, по существу.

Позвоните нам → Напишите нам →

Технологии

Показатель	Цифра за 2025	Что это значит для вас
Выручка мобильных приложений с генеративным ИИ	225 млрд ₽, +273% год к году	Самостоятельное AI-приложение теперь — полноценный продукт, а не просто функция.
Время в приложениях с генеративным ИИ	48 млрд часов (×3,6 к 2024)	Привычка у пользователей сформировалась — ассистенты теперь конкурируют с вашим приложением за время сессии.
Внедрение разработчиками	63% выпускают не менее одной AI-функции	Не выпускать ИИ в 2026 году — это уже конкурентное отставание, а не нейтральный выбор.
Прирост вовлечённости от персонализации	+62% вовлечённости, +80% конверсии	Одни только AI-рекомендации влияют на финансовый результат.
Пользователи мобильных AI-ассистентов (США)	200 млн+ (110 млн — только на мобильных)	Пользователи ожидают, что голосовой и текстовый ИИ будет работать везде.
Прогноз Gartner	Использование мобильных приложений снизится на 25% к 2027 году (из-за AI-ассистентов)	Приложения без встроенного ИИ будут терять пользователей в пользу системных ассистентов.

Фреймворк / API	Платформа	Лучше всего для	Типичная задержка	Структура затрат
Core ML	iOS, macOS, watchOS	Зрение и NLP на устройстве с Apple Neural Engine	< 100 мс	Разовая, внутри приложения
Apple Foundation Models	iOS 18+, macOS 15+	LLM на устройстве, резюмирование, инструменты письма	< 500 мс	Бесплатно (в составе ОС)
TensorFlow Lite / LiteRT	Android, iOS, Web	Кроссплатформенное ML на устройстве	< 200 мс	Разовая, внутри приложения
MediaPipe	Android, iOS, Web	Поза, руки, лицо, жесты, сегментация	< 100 мс	Разовая, внутри приложения
ML Kit (Google)	Android, iOS	Распознавание текста, штрихкоды, перевод, обнаружение лиц	50 мс–2 с	Бесплатный тариф + оплата за запрос
Gemini Nano (AICore)	Android (Pixel 9+, S26+)	LLM на устройстве, резюмирование, подсказки ответов	< 1 с	Бесплатно (в составе ОС)
ONNX Runtime Mobile	Android, iOS, Web	Переносимые модели между фреймворками	< 300 мс	Разовая, внутри приложения
OpenAI API (GPT-5)	Облако	Рассуждения, код и зрение уровня state-of-the-art	1–3 с	93,75–750 ₽ за 1 млн токенов
Anthropic Claude API	Облако	Рассуждения с длинным контекстом, анализ, код	1–3 с	75–1 875 ₽ / 1 млн токенов (скидка 50% при батч-обработке)
Google Gemini API	Облако	Мультимодальность, экономичный текст и зрение	1–2 с	6–375 ₽ / 1 млн токенов
AWS Rekognition	Облако	Анализ изображений и видео, модерация	500 мс–2 с	0,075–0,9 ₽ за изображение
Azure Cognitive Services	Облако	Корпоративное видение, стиль общения, язык	500 мс–2 с	За запрос + подписка

Объём	Пример функции	Сроки	Ориентировочная стоимость
Одна функция на устройстве	Сканирование документа + OCR	4–8 недель	2–6 млн ₽
Гибрид среднего размера	Зрение на устройстве + облачный LLM-чат	8–14 недель	6–13,5 млн ₽
Полноценный гибрид под продакшн	Оркестрация нескольких моделей, RAG, мониторинг	14–22 недели	11,2–22,5 млн ₽
Корпоративная платформа	Регулируемая отрасль (здравоохранение / финтех), несколько регионов, SLA	22+ недели	от 22,5 млн ₽

Платформа	Для чего лучше всего	Стартовая цена	Нужна гарнитура?
ClassVR	Школа (K–12), более 1 500 сценариев по учебной программе	от 75 000 ₽ за школьный комплект	Да (гарнитуры в комплекте)
Labster	Лаборатории биологии, химии, физики в вузах	5 925–8 175 ₽ за студента в год	Нет (браузер + опционально VR)
Nearpod (с VR)	Встраивание в уроки в школе	11 925–29 775 ₽ в год на преподавателя	Опционально
zSpace	AR/VR без гарнитуры; более 3 500 округов	По запросу (фирменное оборудование)	Нет (очки + дисплей с трекингом)
Prisms VR	Математика и естественные науки, 140 округов	По запросу (лицензия округа)	Да
Engage / Spatial	Совместные классы в высшем образовании	37 500–150 000 ₽ в год за помещение	Да (несколько устройств)
CoSpaces Edu	VR-проекты, которые создают сами ученики	75–225 ₽ за ученика в год	Опционально
Osso VR / FundamentalVR	Хирургическая подготовка	450 000–3 млн ₽ в год за рабочее место	Да

Статья расходов	Год 1	Год 2 и далее
30 × Meta Quest 3S (комплект за 37 500 ₽)	1 125 000 ₽	0 ₽ (обновление раз в 3–4 года)
Контент-платформа (ClassVR / Nearpod)	150 000–375 000 ₽	150 000–375 000 ₽
Обучение преподавателей (1 день)	112 500–225 000 ₽	Обновление: 37 500 ₽/год
Зарядная станция + MDM	112 500–187 500 ₽	0 ₽
Страховка / поломки (10%)	112 500 ₽	112 500 ₽
Итого	1,6–2 млн ₽	300 000–525 000 ₽

AI-видеоаналитика: полный гид по умным системам безопасности в 2026 году

01. Почему этот гид написала Фора Софт

02. Что такое AI-видеоаналитика для безопасности на самом деле

03. Состояние рынка: куда идут инвестиции в умную безопасность в 2026

04. Восемь сценариев, где аналитика на основе ИИ окупается в сфере безопасности

1. Розница: предотвращение потерь и ORC

2. Общественная безопасность и умные города

3. Транспорт и парковки

4. Промышленность: СИЗ и охрана труда

5. Медицинские учреждения

6. Школы и университеты

7. Госсектор и критическая инфраструктура

8. Стройка и контроль прогресса работ

05. Эталонная архитектура: семь уровней пайплайна аналитики безопасности

Слой 1. Камеры и приём потока

Слой 2. Edge-узел инференса

Слой 3. Серверный уровень

Слой 4. Данные и индекс

Слой 5. Интеграция с VMS

Слой 6. Оповещения и рабочие процессы

Слой 7. Аудит и управление

06. Сравнительная матрица: семь платформ умной безопасности

07. Edge vs cloud: где запускать инференс

08. Слой моделей: что реально можно запускать на ваших камерах

09. Интеграция с VMS: как подключить аналитику к существующему стеку

10. Пайплайн оповещений: как превратить обнаружения в действия

11. Соответствие нормам: NDAA, EU AI Act, GDPR, HIPAA, BIPA

12. Мини-кейс: как MindBox достигает 99,5% точности распознавания лиц на 500 000 автомобилей в день

13. Финансовая модель: оценка проекта на 200 камер «под ключ»

14. Фреймворк решений: выбор подхода к безопасности ИИ за пять вопросов

15. Подводные камни — шесть самых частых ошибок

16. KPI: что измерять и какие целевые значения важны

17. Приватность по умолчанию: как заслужить доверие людей на видео

18. Когда не стоит внедрять AI-видеоаналитику прямо сейчас

19. Защита системы: что заложить с самого начала

20. Что дальше: три сдвига 2026–2027, к которым стоит готовиться

21. FAQ

22. Что почитать дальше

Подводя итог

Похожие статьи

Хотите обсудить ваш проект?

12. Мини-кейс: как MindBox достигает 99,5% точности распознавания лиц на 500 000 автомобилей в день