
Главное
• VALT доказывает, что модель работает. Интеллектуальная система видеонаблюдения, которую разработала Фора Софт, приносит 727 млн ₽ годовой выручки, поддерживает 2 500 IP-камер и обслуживает 25 000 пользователей в день в 650 организациях США.
• Рынок это подтверждает. Мировые расходы на VMS растут с 4,08 трлн ₽ (2024) до 6,65 трлн ₽ (2030) при среднегодовом темпе роста 8,5%; один только сегмент AI-видеоаналитики прибавляет 22,7% в год вплоть до 2031-го.
• Интеллект важнее простой записи. Запись по движению, поиск по произнесённым словам, пресеты PTZ, PDF с расшифровкой и приём видео с мобильных камер — именно эти функции закрывают корпоративные сделки в 2026 году.
• Масштаб решает архитектура. Камеры ONVIF Profile T, кодирование в H.265, приём через Wowza и стек на Vue 3 / Node.js / Symfony позволяют одному кластеру обслуживать 2 500 камер без перегрузки канала.
• Разрабатывать или покупать — вопрос числа камер. Менее 100 камер — покупайте Verkada или Eagle Eye. Более 500 камер с нестандартными рабочими процессами — математика склоняется к разработке, а Agent Engineering в Фора Софт сжимает сроки ниже средних по отрасли.
Почему Фора Софт написала это руководство
Эта статья родилась не из маркетингового брифа. Мы написали её потому, что выпустили VALT — интеллектуальную систему видеонаблюдения, о которой пойдёт речь ниже, — и теперь сопровождаем её для более чем 650 организаций США: полицейских управлений, центров защиты детей и медицинских вузов. Каждое архитектурное решение, каждый выбор кодека, каждый сценарий работы с PTZ на этой странице проверены в продакшене на реальных комнатах для допросов, реальных учебных симуляциях и реальных цепочках записанных доказательств.
VALT — не разовый проект. В нашем портфолио есть дроновое наблюдение с воздуха для контроля территорий, заказные ML-пайплайны для обнаружения аномалий, интеграции аналитики ONVIF Profile M и приём видео с мобильных камер для клиентов, которым нужно было наблюдение за пределами фиксированной сетки камер. Около 40% наших активных инженерных ресурсов заняты видео, видеостримингом и компьютерным зрением — дисциплинами, которые нужны современному партнёру по разработке систем видеонаблюдения, чтобы выпустить достойный продукт.
Если вы прорабатываете VMS, интеллектуальный модуль мониторинга для существующего парка камер или вертикальный продукт для видеонаблюдения (полиция, здравоохранение, образование, ритейл, умный город), эта статья проходит те же компромиссы, что мы прошли с нашими клиентами, — от выбора протокола стриминга до конкретных затрат — и показывает, как Фора Софт реализует проект с помощью Agent Engineering, чтобы сжать сроки и цену.
Прорабатываете собственную интеллектуальную систему видеонаблюдения?
Обсудите архитектуру с командой, которая выпустила VALT: расчёт нагрузки на канал, выбор кодеков, совместимость с ONVIF, дорожную карту ML-функций.
VALT в цифрах
VALT — это интеллектуальная система видеонаблюдения, или, в терминах отрасли, система управления видео (Video Management System, VMS) со встроенной AI-аналитикой. Ниже — как этот бизнес выглядит сегодня.
| Показатель | Сегодня | Что это доказывает |
|---|---|---|
| Годовая выручка | 727 млн ₽ | Вертикальная интеллектуальная VMS масштабируется финансово, не конкурируя с Verkada в лоб. |
| Поддерживаемых IP-камер | 2 500 | Архитектура справляется с корпоративной плотностью камер, а не только с демо для малого бизнеса. |
| Активных пользователей в день | 25 000 | Одновременное воспроизведение потоков и RBAC масштабируются за пределы пилотных внедрений. |
| Организаций-клиентов | 650 (США) | Изоляция арендаторов, журналирование действий и биллинг отработаны на масштабе. |
| Отраслевой охват | Полиция, медицинские вузы, защита детей | Три регулируемые среды на одном продукте — точки соприкосновения с CJIS, HIPAA и FERPA закрыты. |
| Ключевые AI-функции | Запись по движению, поиск по произнесённым словам, приём видео с мобильных камер, расшифровка в PDF | Отличие от типовых конкурентов уровня NVR и облачных VMS. |
Видео продукта ниже показывает рабочий процесс, которым операторы пользуются на самом деле. Это реальный интерфейс, а не маркетинговая визуализация.
Посмотрите двухминутный обзор продукта VALT на YouTube →
Что на самом деле означает интеллектуальный видеомониторинг в 2026 году
Этот термин используют вольно. Для покупателей «интеллектуальный» может означать как маркетинговый датчик движения, так и полноценный ML-пайплайн, классифицирующий поведение. Ниже — рабочее определение, которое мы используем при проработке проектов; оно построено на функциях, которые корпоративные закупки проверяют на практике.
Уровень 1 — умный захват (базовый минимум в 2026 году)
Запись по движению. Камера или сервер фиксируют движение и записывают только нужные фрагменты, сокращая затраты на хранение на 60–90%. Именно функция детекции движения в VALT позволяет уместить политику хранения на 30 дней на обычных дисках.
Пресеты PTZ и запись по расписанию. Операторы задают положения камеры для пересменок — одним кликом камера обводит всю комнату для допросов или весь лабораторный стол. В сочетании с планировщиком камера покрывает шестичасовую симуляцию без участия оператора.
Двусторонняя аудиосвязь (push-to-talk). Двусторонний голос через ту же камеру — это граница между «видеонаблюдением» и «системой мониторинга». Необходима медицинским преподавателям и специалистам, ведущим опрос детей.
Уровень 2 — доказательства с возможностью поиска
Поиск по произнесённым словам. Введите слово — и система перейдёт к каждому моменту, где оно было произнесено. VALT накладывает Amazon Transcribe от AWS на аудиодорожку и индексирует расшифровки. Для полицейских допросов это превращает 8-часовое видео в инструмент поиска доказательств одним нажатием. Лежащую в основе интеграцию мы описывали в услуге заказной разработки распознавания речи.
Заметки с привязкой ко времени. Проверяющие отмечают конкретные кадры; метки становятся гиперссылками в экспортированном PDF. Этот PDF — артефакт, который идёт в суд, в файлы обратной связи по студентам или в дело о защите ребёнка.
Гранулярные права доступа. RBAC на уровне камеры, папки и пользователя, подкреплённый неизменяемым журналом действий. Без него продукт не пройдёт проверку CJIS или HIPAA.
Уровень 3 — понимание на основе ML
Обнаружение объектов и людей. Пайплайны на YOLOv8/YOLOv11 размечают людей, транспорт, лица, посылки. Наш подробный разбор моделей обнаружения — в материале «Топ-7 моделей обнаружения аномалий для видеонаблюдения».
Обнаружение аномалий. Модели без учителя помечают необычные паттерны движения — праздношатание, присутствие в нерабочее время, аномальную плотность толпы. О применяемых нами схемах инференса — в материале про обнаружение аномалий в видеонаблюдении в реальном времени.
Поведенческая аналитика. Подсчёт, время пребывания, длина очереди, контроль ношения СИЗ, обнаружение падений. Технический разбор задокументирован в нашем руководстве по интеграции видеоаналитики с системами наблюдения.
Берите полный ML-стек, когда: главный KPI заказчика — сэкономленные часы работы операторов (сокращение ложных тревог, автоматический разбор инцидентов), а не просто запись для соответствия требованиям. Примерно до 50 камер базовые уровни 1 и 2 дают тот же результат за половину стоимости разработки.
VALT изнутри — стек, который мы выпустили
Архитектура — это то, на чём ломается большинство разработок VMS. Мы выбрали стек, который открыт, позволяет быстро итерировать и дёшево масштабируется.
| Слой | Технология | Почему выбрали |
|---|---|---|
| Фронтенд | Vue 3 (Composition API) | Быстрые итерации над плотным интерфейсом оператора; реактивные ссылки естественно ложатся на состояние сетки камер. |
| API и аутентификация | Symfony 5 (PHP) | Зрелый RBAC, простой middleware для журнала действий, сильная экосистема тестирования — это важно при проработке CJIS/HIPAA. |
| Реальное время / сигналинг | Node.js + Socket.io | Браузеры, мобильные клиенты и API на Symfony говорят на одном протоколе событий с задержкой менее 100 мс. |
| Движок стриминга | Wowza Streaming Engine | Приём RTSP с камер, перекодирование в HLS/WebRTC, горизонтальное масштабирование на обычном Linux. Альтернативы мы сравнивали в материале P2P vs MCU vs SFU. |
| ASR / расшифровка | Amazon Transcribe | Оплата за минуту, пользовательские словари для юридического и медицинского жаргона, английский и испанский из коробки. |
| Хранилище | S3 + многоуровневое хранение | Горячий 7д → тёплый 30д → Glacier; сокращает затраты на хранение примерно на 70% против одноуровневого. |
| Приём с камер | ONVIF Profile T + RTSP, плюс SDK для iOS/Android для использования телефона как камеры | Profile T покрывает H.265, авторизацию по HTTPS, современный PTZ. Приём с мобильных открывает временные площадки без закупки оборудования. |
Подробный разбор ONVIF Profile M и его места рядом с Profile T — в нашем материале об ONVIF Profile M.
Эталонная архитектура интеллектуальной VMS
Схема ниже — это канонический пайплайн, который мы разворачиваем. Камеры отдают RTSP в кластер Wowza, кластер раздаёт HLS для множества зрителей и WebRTC для живой операторской консоли, а параллельные задачи питают слои ML и ASR.
| Этап | Компонент | Результат |
|---|---|---|
| 1. Захват | Камеры ONVIF Profile T / мобильный SDK | Поток RTSP H.265 |
| 2. Приём и перекодирование | Кластер Wowza (Linux, автомасштабирование) | HLS (браузеры), WebRTC (операторы), MP4 (архив) |
| 3. Хранение | S3-совместимое объектное хранилище с жизненным циклом | Горячий/тёплый/холодный архив с TTL |
| 4. ASR | Amazon Transcribe / Whisper Large-v3 | JSON-расшифровка с временными метками на уровне слов |
| 5. ML-инференс | YOLOv8/v11 на Jetson Orin или облачном GPU T4 | События по объектам/людям/аномалиям |
| 6. Поисковый индекс | OpenSearch / Elastic, с привязкой ко времени | Поиск по словам и объектам |
| 7. API | Symfony 5 + Node.js Socket.io | Аутентификация, RBAC, журнал действий, события в реальном времени |
| 8. Клиент | Веб на Vue 3 + нативные iOS/Android | Консоль оператора, мобильный просмотр, экспорт в PDF |
Эта же восьмиэтапная схема работает и для 50 камер в одной школе, и для 2 500 в национальной сети — приём и ML масштабируются горизонтально, а API и поиск остаются однопользовательскими для каждого клиента.
Выбор протокола стриминга — RTSP, HLS или WebRTC
Продукту для видеонаблюдения почти всегда нужны все три протокола. Покупатели и инженеры их путают, а затем закладывают лишний бюджет. Разделение ниже — то, как мы это устроили в VALT.
| Протокол | Задержка | Одновременных зрителей | Для чего использовать |
|---|---|---|---|
| RTSP | 50–200 мс | 1 (только сервер) | Приём с камеры на сервер. Никогда не отдавайте в браузер. |
| WebRTC | ~300 мс | сотни на SFU | Живая консоль оператора, двусторонний звук, управление PTZ. Нижний порог задержки для «реального времени». |
| LL-HLS | 2–5 с | не ограничено (CDN) | Массовые дашборды, мобильный просмотр, маломощные устройства. |
| HLS (классический) | 8–12 с | не ограничено (CDN) | Воспроизведение записей, разбор доказательств, аудиторские выгрузки. |
Берите WebRTC, когда: оператор должен говорить в помещение (push-to-talk), управлять PTZ в реальном времени или реагировать в пределах двух секунд. В остальных случаях по умолчанию выбирайте LL-HLS — дешевле на масштабе, меньше проблем с фаерволами.
Выбираете между Wowza, Ant Media и Janus?
Мы выпускали продакшен-внедрения VMS на всех трёх. Подберём движок под число ваших камер, целевую задержку и бюджет за один звонок.
Канал и хранение — цифры, которые губят плохие бюджеты
Бюджеты на VMS взрываются, когда покупатели недооценивают битрейт камер. Расчёт ниже — то эмпирическое правило, которым мы пользуемся при проработке.
| Разрешение | Кодек | Битрейт | ГБ/сутки на камеру | 100 камер / 30 дней |
|---|---|---|---|---|
| 720p @ 15 fps | H.265 | 0,3 Мбит/с | 3,2 ГБ | ~10 ТБ |
| 1080p @ 30 fps | H.265 | 0,5 Мбит/с | 5,4 ГБ | ~16 ТБ |
| 1080p @ 30 fps | H.264 | 1,0 Мбит/с | 10,8 ГБ | ~32 ТБ |
| 4K @ 30 fps | H.265 | 1,5–3 Мбит/с | 16–32 ГБ | ~50–100 ТБ |
| 1080p @ 30 fps + только по движению | H.265 | 0,5 Мбит/с (пик) | ~1 ГБ (типично) | ~3 ТБ |
Из этой таблицы следуют три правила. Первое: H.265 не обсуждается; он вдвое сокращает хранение при том же визуальном качестве. Второе: запись по движению срезает ещё 70–80%. Третье: используйте многоуровневое хранение — горячее на 7 дней, тёплое на 30, холодное для юридического «хвоста», — иначе счёт за S3 станет той строкой, которую заблокирует финансовый директор.
Разрабатывать или покупать — правило числа камер
Честный ответ зависит от числа камер, отрасли и того, насколько нестандартны рабочие процессы. Ниже — фреймворк, который мы разбираем с потенциальными клиентами, включая случаи, когда мы прямо советуем купить готовый продукт вместо найма нас.
| Сценарий | Рекомендация | Почему |
|---|---|---|
| < 100 камер, типовой сценарий | Купить Verkada / Eagle Eye / Rhombus | Оборудование + облачная подписка дешевле заказной разработки. |
| 100–500 камер, заказная аналитика | Гибрид: SDK Milestone или Genetec + заказной ML-слой | Используете проверенное ядро VMS; отстраиваетесь на аналитике. |
| > 500 камер, вертикальный продукт | Разрабатывать на заказ (это зона VALT) | Маржа и product-market fit проявляются только при полном контроле над UX, RBAC и ценообразованием. |
| Регулируемый процесс (полиция, больница, суд) | Заказная разработка или гибрид on-prem | Журналирование уровня CJIS/HIPAA и резидентность данных проще, когда стек принадлежит вам. |
| Выход на рынок как SaaS (вы продаёте продукт) | Разрабатывать на заказ | Verkada перепродать нельзя. А то, что мы разработаем для вас, — можно. |
Модель затрат — во что реально обходятся MVP и продакшен-VMS
Ниже мы даём диапазоны, а не отдельные числа, потому что число камер на арендатора, объём ML и объём требований к соответствию доминируют над всем. Диапазоны отражают цены Фора Софт с использованием Agent Engineering — нашего внутреннего процесса разработки с участием ИИ, — которые стабильно оказываются ниже среднего по отрасли ориентира в 9,9 млн ₽ и 13 месяцев для заказной разработки проектов такого размера, который публикуют аналитики.
| Объём | Что входит | Ориентировочный диапазон | Календарь |
|---|---|---|---|
| MVP — умный захват | Приём ONVIF, запись по движению, веб-воспроизведение, RBAC, журнал действий | 4,5–8,2 млн ₽ | 3–4 месяца |
| Слой доказательств с поиском | ASR-расшифровка, заметки с привязкой ко времени, экспорт в PDF | +1,8–3,3 млн ₽ | +1–2 месяца |
| Слой ML-аналитики | Обнаружение объектов/людей, оповещения об аномалиях, дашборды | +2,2–5,2 млн ₽ | +2–3 месяца |
| Телефон-как-камера + клиент iOS/Android | Нативные приложения, мобильный RTSP-энкодер, пуш-уведомления | +2,6–4,5 млн ₽ | +2 месяца |
| Усиление под соответствие (CJIS/HIPAA/SOC 2) | Аудит шифрования, отчёты аудита, пакет для due diligence вендора | +1,5–3 млн ₽ | +1 месяц |
По текущим расходам закладывайте 300–675 ₽ за камеру в месяц на облачный канал и хранение при 1080p H.265 с записью по движению, плюс стоимость ML-инференса (Jetson Orin NX на периферии — разовая закупка оборудования около 26 тыс. ₽; облачный GPU-инференс — примерно 22 ₽ за камеру в сутки при качестве YOLOv8).
Безопасность и соответствие — что спросят регулируемые покупатели
VALT работает в трёх регулируемых отраслях, и каждая проверила свой аспект соответствия.
1. CJIS для полиции. Данные уголовного правосудия требуют защищённых от подделки журналов действий, шифрования при передаче и хранении и строгого разделения между ведомствами. Мы изолируем хранилище каждого арендатора на уровне бакета, подписываем каждую запись в журнал хеш-цепочкой и запрещаем экспорт без поля с обоснованием.
2. HIPAA для медицинского обучения. Идентифицирующие пациента записи из симуляционных центров требуют, чтобы ключами шифрования управляло учреждение, и аудита по принципу break-glass при каждом просмотре. Мы поддерживаем KMS для каждого арендатора, облачные регионы, готовые к подписанию BAA, и отзыв доступа в один клик.
3. FERPA для защиты детей и образования. Записи с несовершеннолетними подразумевают согласие родителей и короткие сроки хранения. Мы выносим политики хранения как TTL на уровне папок, которые учреждение задаёт в интерфейсе, а не инженер.
4. SOC 2 Type II. Корпоративные закупки всё чаще требуют его как базовый минимум. Стоимость аудита обычно составляет около 1,8–3 млн ₽ за оценку готовности плюс ежегодные сборы аудитора — закладывайте контроли в спринт 1, а не дорабатывайте их на второй год.
5. GDPR для записей из ЕС. Право на удаление данных конкретного человека — это реальная инженерная задача: нужно криптографическое стирание ключа на уровне сегмента плюс готовый для потенциальных клиентов шаблон соглашения об обработке данных.
Сценарии, которые окупают продукт
Частая ошибка в продуктах для наблюдения — продавать «безопасность», когда покупатели платят за «доказательства», «обучение» или «контроль процесса». Отрасли ниже — те, что реально финансируют заказную разработку VMS.
Правоохранительные органы и пенитенциарная система
Полицейские допросы, приём доказательств с нагрудных камер, камеры предварительного содержания в судах. Пресеты PTZ покрывают стандартную планировку комнаты для допросов; поиск по произнесённым словам позволяет детективу найти «он назвал адрес» за семь секунд вместо семи часов; PDF с расшифровкой идёт прямо в материалы дела. Журнал действий уровня CJIS — функция, без которой сделки не будет.
Медицинское и клиническое обучение
Симуляционные центры медицинских вузов записывают экзамены OSCE, ординаторские хирургические тренировки и приёмы со стандартизированными пациентами. Экзаменаторы приближают технику рук, ставят заметку с привязкой ко времени и экспортируют PDF-отчёты по каждому студенту. Тот же процесс переносится на сестринские школы, академии парамедиков и стоматологические симуляционные лаборатории.
Защита детей и судебный опрос
Центры, записывающие опросы уязвимых несовершеннолетних, работают на пределе требований к приватности и проверяемости. Двухкамерное покрытие (лицо + помещение), защищённый от подделки аудит и короткие окна хранения не обсуждаются. Экспорт в PDF становится артефактом, которым делятся с прокурорами и сотрудниками органов защиты детей.
Смежные отрасли, которые стоит проработать
Безопасность на производстве: обнаружение объектов для контроля ношения СИЗ с оповещениями начальникам цехов. Защита от потерь в ритейле: анализ времени пребывания и аномалий на выходе с распознаванием номеров на парковке. Умный город: подсчёт трафика, плотность толпы, классификация транспорта. Дроновое наблюдение с воздуха: разобрано в нашем кейсе DSI Drones — другой класс камер, идентичный пайплайн дальше по цепочке.
Мини-кейс — чему нас научил выпуск VALT
Ситуация. Клиент пришёл в Фора Софт с работающим, но упирающимся в канал продуктом: около 400 камер, частые подвисания потока, когда вживую подключалось более 30 проверяющих, и поиск доказательств, сканировавший только имена файлов. Дорожная карта требовала масштабирования до тысяч камер, добавления поиска по произнесённым словам и поддержки iPad как камер в комнатах для опроса детей — без утроения облачного счёта.
План. Двенадцать недель. Спринты 1–2: заменить энкодер потока на Wowza, перевести камеры на приём в H.265. Спринты 3–4: добавить Amazon Transcribe + OpenSearch для поиска по словам. Спринты 5–6: выпустить нативные энкодеры для iOS/Android, чтобы телефоны стали RTSP-камерами. Спринты 7–8: рабочий процесс пресетов PTZ, заметки с привязкой ко времени, экспорт в PDF. Спринты 9–10: журналирование с изоляцией по арендаторам, аудит шифрования уровня CJIS, нагрузочный тест на 2 500 камер.
Результат. Число камер выросло с 400 до 2 500 (+525%); число одновременных проверяющих перевалило за 25 000 в день; канал на камеру упал на 48% благодаря H.265 + записи только по движению; выручка выросла до уровня 727 млн ₽ в год, на котором продукт держится сегодня. Продукт теперь обслуживает 650 организаций в полицейской, медицинской и детозащитной отраслях на одной мультиарендной кодовой базе. Хотите такую же 12-недельную оценку для своей VMS? Позвоните нам по номеру +7 (911) 236-51-91 или напишите на info@fora-soft.ru.
Edge AI против облачного инференса для ML-функций
Как только вы добавляете ML, нужно решить, где он работает. Здесь доминируют два принципа.
| Оборудование | Пропускная способность (YOLOv8) | Энергопотребление | Стоимость | Лучше всего для |
|---|---|---|---|---|
| NVIDIA Jetson Orin NX | ~42 FPS | 15 Вт | 22 500–30 000 ₽ | Многокамерный периферийный шлюз, обнаружение аномалий |
| NVIDIA Jetson Nano | ~12 FPS | 5–10 Вт | 11 250–15 000 ₽ | Однокамерный киоск, прототип |
| Google Coral TPU | ~22 FPS | 2–4 Вт | 7 500–11 250 ₽ | IoT на батарейках, только TFLite-модели |
| Пул облачных GPU (T4/L4) | сотни FPS на GPU | н/д | ~22 ₽ за камеру в сутки | 1 000+ камер, частое переобучение моделей |
Берите облачный GPU-инференс, когда: ваш набор моделей меняется ежемесячно, в дорожной карте есть тюнинг под конкретного клиента или число камер превышает ~1 000. Иначе периферийный Jetson Orin дешевле и избавляет от налога на канал, связанного с отправкой каждого кадра в облако.
Фреймворк принятия решения — выберите путь VMS за пять вопросов
1. Вы перепродаёте продукт или просто им пользуетесь? Если планируете продавать его как SaaS, придётся разрабатывать — Verkada перепродать нельзя. Если он нужен только внутри, готовое решение почти всегда дешевле.
2. Сколько камер будет через 24 месяца? Менее 100 — в пользу готового решения. 100–500 — в пользу гибрида (SDK Milestone/Genetec + заказной интерфейс). Более 500 с вертикальным процессом — в пользу заказной разработки вроде VALT.
3. Каков нормативный минимум? CJIS, HIPAA, FERPA, GDPR, SOC 2 — каждый тянет архитектуру в чуть разные стороны. Чем раньше вы зафиксируете минимум, тем дешевле разработка.
4. Целевая задержка? Менее секунды → WebRTC + периферийный инференс. Допустимо 5+ секунд → LL-HLS + облачный инференс, вдвое дешевле.
5. Жизненный цикл ML-модели? Если запросы заказчика к аналитике меняются каждый квартал, заложите пайплайн с обратной связью (хранилище разметки, частота переобучения) в спринт 0. Прикрутить его позже — самый дорогой способ срезать угол в этой области.
Ловушки, в которые мы видели, как попадают команды VMS
1. Недооценка канала на пике. Средний битрейт успокаивает; именно пиковый битрейт в час нагрузки забивает ваш аплинк. Закладывайте 1,5× теоретического пика, а не 1× теоретического среднего.
2. Игнорирование синхронизации времени. Без дисциплины NTP по всем камерам хронология доказательств разваливается. Журнал действий становится неприемлемым в тот день, когда это заметит первый адвокат.
3. Прикручивание соответствия в конце. Журналирование уровня CJIS обходится в 3× дороже при доработке, чем при проектировании сразу. То же верно для шифрования по HIPAA.
4. Пропуск тюнинга ложных срабатываний. Детекция движения, срабатывающая на пролетающее облако в 4 утра, убивает внедрение быстрее, чем отсутствие функции вообще. Настраивайте пороги вместе с заказчиком на 2-й неделе, а не на 6-м месяце.
5. Наивное одноуровневое хранение. 1080p круглосуточно на одном уровне S3 стоит примерно в 4× дороже многоуровневого хранения при сроке хранения 30 дней. Финансовый директор обнаруживает это на 3-м месяце, и проект начинает кровоточить.
KPI — что действительно измерять
KPI качества. Аптайм потока на камеру (цель 99,5%+), сквозная задержка p95 (менее секунды для операторов, <5 с для просмотра), доля ложных срабатываний по оповещениям об аномалиях (менее 5% к 3-му месяцу), полнота поиска по запросам произнесённых слов (более 90% на чистом звуке).
Бизнес-KPI. Годовая выручка на камеру, валовая маржа на арендатора, отток по отраслям, выручка от расширения за счёт добавленных функций (расшифровка, тарифы с апгрейдом ML). Публичные цифры VALT — 727 млн ₽ годовой выручки / 2 500 камер — это примерно 285 000 ₽ на камеру в год, и это ориентир, который нужно превзойти.
KPI надёжности. Среднее время обнаружения зависшего потока (менее 2 минут); среднее время восстановления (менее 10 минут через автоматический failover); полнота журнала действий (100%, без пропусков); RTO и RPO в рамках SLA вендора. Аудиторы соответствия смотрят на них в первую очередь.
Когда НЕ стоит разрабатывать заказную VMS
Мы советуем потенциальным клиентам отступить от заказной разработки, когда (а) число камер ниже 50 и нет амбиций перепродавать как SaaS; (б) у процесса нет вертикальной специфики, с которой не справится готовое решение; (в) операционная команда не готова владеть круглосуточной стриминговой платформой; или (г) общий бюджет менее 6 млн ₽ не позволяет выйти за рамки усиленного MVP.
В любом из этих случаев подписка на Verkada или Eagle Eye Networks в связке с интеграционным проектом — а интеграцию мы всё равно поможем построить — доведёт вас до результата на полгода быстрее.
Хотите вердикт «разрабатывать или покупать» в письменном виде?
После короткого разговора пришлём рекомендацию на одну страницу — включая сравнение Wowza/Ant Media/Janus и реалистичную бюджетную строку под число ваших камер.
Частые вопросы
В чём разница между VMS и интеллектуальной системой видеонаблюдения?
VMS (система управления видео) записывает, транслирует и хранит потоки с камер. Интеллектуальная система видеонаблюдения добавляет сверху ИИ — детекцию движения, распознавание объектов, оповещения об аномалиях, поиск по произнесённым словам. VALT — это VMS со всеми четырьмя AI-слоями внутри.
Сколько времени занимает выпуск MVP интеллектуальной VMS с Фора Софт?
От трёх до четырёх месяцев для MVP с умным захватом (приём ONVIF, запись по движению, веб-воспроизведение, RBAC, журнал действий). Добавление доказательств с поиском и ML-аналитики обычно прибавляет сверху от двух до четырёх месяцев в зависимости от объёма. Agent Engineering в Фора Софт ощутимо сжимает эти сроки ниже отраслевого ориентира в 13 месяцев.
Может ли смартфон действительно заменить фиксированную IP-камеру?
Для временных площадок, учебных классов и опросов в центрах защиты детей — да. Мобильный SDK VALT превращает любое устройство на iOS или Android в RTSP-источник, питающий тот же приём через Wowza. Вы теряете PTZ и круглосуточный монтаж, но получаете развёртываемый за минуты захват менее чем за 30 000 ₽ оборудования.
Почему H.265 и ONVIF Profile T, а не Profile S?
Profile S — это устаревший уровень ONVIF: H.264, слабая аутентификация. Profile T — современный уровень: H.265 (экономия хранения 50%), HTTPS, современный PTZ. Покупателям, у которых сегодня Profile S, стоит планировать обновление; поддержка прошивок сворачивается у крупных производителей камер.
ML должен работать на периферийном оборудовании или в облаке?
Периферия (Jetson Orin NX), когда парк камер превышает ~50 на площадку, а ограничение — канал или приватность. Облако, когда набор моделей часто меняется, вы хотите меньше движущихся частей или в дорожной карте есть тюнинг модели под каждого клиента. Мы регулярно выпускаем гибрид — периферия для детекции на горячем пути, облако для переобучения и аналитики.
VALT — единственный продукт для видеонаблюдения, который выпустила Фора Софт?
Нет. Мы также разработали DSI Drones — наблюдение с воздуха для контроля территорий — и внесли вклад в ML-пайплайны, задокументированные в нашем руководстве по обнаружению аномалий. Около 40% наших активных инженерных работ заняты видео, стримингом и компьютерным зрением.
Почему Фора Софт дешевле и быстрее отраслевого ориентира?
Мы используем Agent Engineering — внутренний процесс разработки с участием ИИ, который автоматизирует создание каркаса, рефакторинг и значительную часть регрессионного тестирования. Результат — стабильно более короткие сроки и более низкая полная стоимость функции. Конкретные примеры реализации поделимся на ознакомительном звонке.
Что интегрируется с системами уровня VALT из коробки?
Любая камера ONVIF Profile S/T, любой RTSP-источник, мобильные устройства через SDK, AWS Transcribe и Whisper для ASR, OpenSearch/Elastic для полнотекстового поиска и стандартный IdP (SAML/OIDC) для SSO. Заказные интеграции — Genetec, Milestone, Avigilon — прорабатываем под каждый проект.
Что почитать дальше
Разбор ML
Топ-7 моделей обнаружения аномалий для видеонаблюдения
Какие архитектуры обнаружения мы тестируем при добавлении ML в VMS — и какие выпускаем в продакшен.
Реализация
Интеграция видеоаналитики с системами наблюдения
Пошаговое руководство по дооснащению существующего парка камер AI-аналитикой.
Стандарты
ONVIF Profile M и обнаружение объектов
Почему Profile M — стандартный «клей» между камерами и аналитикой и как использовать его правильно.
Лучшие практики
Обработка видео с ИИ в реальном времени — лучшие практики
Паттерны, которыми мы держим задержку, точность и стоимость в равновесии для живых ML-пайплайнов.
Готовы выпустить собственную интеллектуальную систему видеонаблюдения?
У современной интеллектуальной системы видеонаблюдения четыре задачи — чисто захватывать, мгновенно искать, автоматически понимать и доказывать происхождение. VALT показывает эти четыре задачи в работе при 727 млн ₽ годовой выручки; архитектура, выбор кодеков и уровень ONVIF — это рычаги, которые решают, выйдет ли ваша разработка на те же цифры или сгорит на счёте за канал.
Если число ваших камер, ваша отрасль или ваш выход на рынок как SaaS ставят вас в колонку «разрабатывать» из таблицы выше, самый быстрый следующий шаг — 30-минутный разговор с командой, которая уже выпустила систему, обслуживающую 25 000 пользователей в день. Мы разберём архитектуру, математику кодеков и реалистичную стоимость за один сеанс — и честно скажем, когда купить было бы дешевле.
Поговорите с командой, стоящей за VALT
Запланируйте 30-минутный разговор. Мы проработаем вашу VMS — камеры, кодеки, ML, соответствие требованиям, сроки и бюджет — за один сеанс.
