
Главное
• Потери розницы достигли 9 трлн ₽ в 2024 году, а число краж в магазинах выросло на 93% с 2019-го. Облачные видеоплатформы с AI-системой защиты от потерь окупаются за 90–180 дней, а не за годы.
• Гибрид edge–cloud — единственная архитектура, которую имеет смысл выпускать в 2026 году. Инференс на edge (<50 мс) ловит обход сканирования вживую; облако держит хранилище доказательств за 90 дней, ищет паттерны организованной преступности и переобучает модели.
• «Разрабатывать или купить» — это в основном задача на математику. До ~75 магазинов по совокупной стоимости владения выигрывает managed VSaaS (Solink, Rhombus, Verkada, Spot AI); выше ~150 магазинов или с уникальным процессом POS-интеграции и защиты от потерь заказная разработка окупает себя за три года.
• Откажитесь от «голого» распознавания лиц. BIPA (75 тыс.–375 тыс. ₽ за запись), CCPA (562 тыс. ₽ за нарушение) и GDPR (€20 млн или 4% выручки) делают детекцию по позе, походке и поведению путём с меньшим риском. Распознавание лиц оправдано только для списков известных нарушителей с железобетонным согласием.
• Что мы готовы для вас собрать. Edge-пайплайн на YOLOv11 + RTSP / MediaMTX, ингест на Kinesis или self-hosted, хранилище доказательств на S3 / R2, корреляция исключений POS и React-консоль для службы защиты от потерь — с опорой на нашу платформу видеонаблюдения V.A.L.T., которая уже обслуживает более 700 организаций и 25 000 ежедневных пользователей.
Почему этот гайд написала Фора Софт
Фора Софт уже 21 год разрабатывает продукты для видео в реальном времени и компьютерного зрения. Наш флагманский проект в области видеонаблюдения — V.A.L.T. — работает как SaaS-платформа управления видео в более чем 700 организациях: подразделения полиции США, залы суда, центры защиты прав детей, медицинские школы. Платформа принимает живой RTSP с более чем 2 500 IP-камер и обслуживает 25 000 активных пользователей в день. Это тот масштаб, на котором «облачная видеоплатформа» перестаёт быть маркетинговой формулировкой и превращается в ежедневную борьбу со счетами за трафик, усталостью от ложных срабатываний и запросами на выдачу записей.
Конкретно для розницы мы разрабатывали решения по распознаванию объектов на камерах, дашборды видеоаналитики и движки оповещений, корреллированных с POS, поверх YOLO, OpenCV, FFmpeg, MediaMTX и медиастеков AWS / Azure. Мы используем Agent Engineering — генерацию кода мультиагентами в паре с ревью senior-инженеров — что сжимает циклы исследования и прототипирования примерно на 30–40% по сравнению с базовым ручным кодированием. Поэтому пилот на 20 магазинов с нами обычно укладывается в 10–14 недель, а не в 16–20, которые называют вендоры на тот же объём заказной работы.
Этот гайд — то, что мы вручаем руководителям службы безопасности и инженерных команд розницы до того, как они подпишут контракт — с нами или с кем-то ещё. Он рассчитан на тех, кто понимает, что такое потери, организованная преступность в рознице и исключения POS, и хочет уйти со страницы с обоснованной архитектурой, честной моделью затрат и списком из пяти вопросов, которые решают «разрабатывать или купить».
Уже теряете больше 2,2 млн ₽ в месяц на потерях?
Запишитесь на 30-минутный архитектурный разбор. Мы прикинем гибридный edge–cloud-пайплайн под количество ваших магазинов и честно скажем, что выгоднее: разработать с нуля, купить или совместить оба подхода.
Что такое облачная видеоплатформа в рознице
Облачная видеоплатформа — корректнее называть её Video Surveillance as a Service (VSaaS) — это слой, который принимает RTSP с ваших IP-камер, хранит записи в объектном хранилище с заданным сроком хранения, прогоняет потоки через модели детекции и классификации и даёт веб- или мобильную консоль для службы защиты от потерь, операционного управления магазинами и юридических запросов. «Облачная» означает, что не нужно держать на месте NVR или DVR и нянчить их; AI-составляющая снимает необходимость держать круглосуточные операторские с реальным временем устойчивого внимания около 22 минут.
Розничный VSaaS отличается от обобщённого SaaS для IP-камер тремя вещами:
1. Корреляция с POS / SCO. Каждое оповещение сопоставляется с потоком кассовых событий, поэтому вы можете доказать, что событие «no-sale» или «post-void» совпало с поведением сокрытия товара на камере, в той же кассовой линии, в ту же секунду.
2. Поведенческие модели, а не просто детекция объектов. Обобщённый SaaS скажет, что в кадр зашёл человек. Розничный инструмент сообщит, когда кто-то прячет товар, обходит сканирование или совпадает с ранее отмеченным паттерном организованной преступности в нескольких магазинах.
3. Хранение уровня доказательств. Видеоролики с цепочкой хешей, многоуровневое хранение от 7 до 365 дней, журналы аудита и подписанные пакеты экспорта, которые ваша юридическая команда может передать обвинению без замечаний к цепочке хранения доказательств.
Рынок: потери, VSaaS и AI в рознице
Контекст рынка определяет, какая архитектура заслуживает ваших денег. Большую часть работы делают три цифры.
| Показатель | Данные за 2024 / 2025 | Что это значит для решения «разрабатывать или купить» |
|---|---|---|
| Потери розницы в Северной Америке | 9 трлн ₽ (NRF, 2024) | Больше чистой прибыли большинства ритейлеров; оправдывает инвестиции в платформу с шестью нулями. |
| Кражи в магазинах | +93% к 2019; +24% в первой половине 2024 | Ручной мониторинг больше не масштабируется; AI-фильтрация обязательна. |
| Мошенничество на кассах самообслуживания (Северная Америка) | 375–600 млрд ₽ в год; 1 из 3 инцидентов | Обеспечивает окупаемость POS-корреллированных оповещений именно на SCO-кассах. |
| Мировой рынок VSaaS | 270–885 млрд ₽ в 2024; CAGR 16–27% | Здоровый пул вендоров — можно покупать с разумным риском по непрерывности. |
| AI в рознице | 750 млрд ₽ (2023) → ~4,1 трлн ₽ к 2033, CAGR 18,6% | Защита от потерь финансируется из бюджетов цифровой трансформации, а не только службы безопасности. |
Читать таблицу так: проблема достаточно крупная, чтобы профинансировать настоящую платформу; рынок достаточно зрелый, чтобы покупать, если хочется; и эти расходы теперь сидят в бюджетах CIO / CTO, а не в дискреционных тратах службы защиты от потерь.
Эталонная архитектура: гибрид edge–cloud от и до
Каждый успешный VSaaS для розницы, который мы видели, сходится к одной форме. Камеры отдают RTSP на шлюз внутри магазина. Шлюз локально выполняет инференс первой ступени и POS-корреляцию, а в облачную плоскость управления передаёт события — не сырые потоки. Облако отвечает за долговременное хранение, межмагазинную аналитику и интерфейс оператора.
Рисунок 1. Эталонная гибридная edge–cloud архитектура для VSaaS многомагазинной розничной сети.
Три вещи делают эту архитектуру работоспособной в продакшене или ломают её:
1. У edge-шлюзов должна быть очередь. Когда WAN в магазине упадёт — а он упадёт — события буферизуются локально и пересинхронизируются. Без этого день, когда выделенная линия отказывает, становится днём потери доказательств.
2. Облако видит только то, что важно. Стриминг сырого 1080p с 200 камер 24/7 в S3 тихо принесёт 1,8–3 млн ₽/месяц на egress и хранение. Отправляйте ролики событий и метаданные, а не полные потоки, пока флаг расследования не запросит полную запись.
3. POS-корреляция — равноправный гражданин, а не интеграция. Шина событий POS должна приземляться на тот же шлюз, что и видеопайплайн, чтобы события «no-sale» и «сокрытие товара» соединились за <1 секунду.
Берите гибрид edge–cloud, когда: у вас больше пяти магазинов, средний аплинк меньше 100 Мбит/с или хотя бы один магазин в регионе, где нельзя легально экспортировать сырое видео (ЕС, отдельные страны АТР). Ниже этого порога для пилота достаточно cloud-only.
Протоколы стриминга: RTSP на входе, HLS / WebRTC на выходе
Каждая платформа для розницы, которую мы делали, в итоге использует два-три протокола на разных уровнях. Ошибка в выборе — и вы либо жжёте деньги на трафике, либо в момент инцидента заставляете операторов смотреть на дашборд с задержкой в 6 секунд.
| Протокол | Задержка | Где использовать | На что обратить внимание |
|---|---|---|---|
| RTSP / RTP | <100 мс | Камера → ингест на шлюзе | Прохождение NAT / firewall; используйте ONVIF для обнаружения. |
| HLS | 2–12 с | Многомагазинные дашборды через CDN | Слишком медленно для мгновенных вмешательств на SCO. |
| LL-HLS | 2–5 с | Live-стена защиты от потерь, near-real-time-плеер | Поддержка плеерами неравномерная вне Safari / hls.js. |
| WebRTC | <1 с | Двусторонний звук, мобильное реагирование | Больше инфраструктуры: TURN-серверы, SFU/MCU; стоимость на просмотр растёт. |
| SRT / RTMP | 1–3 с | Бэкхол по WAN с потерями, бродкаст-мосты | Реже встречается в рознице, полезно для киосков / pop-up магазинов. |
На практике мы используем RTSP для ингеста, LL-HLS для операторской консоли, WebRTC для мобильного приложения службы защиты от потерь и тонкий мост на SRT, если у магазина нестабильный LTE-резерв. Open-source MediaMTX берёт на себя все конвертации на шлюзе и снимает один слой привязки к вендору.
Берите WebRTC, когда: службе защиты от потерь нужно за секунду «толкнуть» голос обратно в магазин («четвёртая касса, закрываем»), или вы продаёте поверх того же стека функцию видеоконсультации для покупателей. Иначе ради экономии оставайтесь на LL-HLS.
AI-модели, которые реально ловят воровство
Одной детекцией объектов воровство не поймаешь — она лишь сообщит, что в кадре человек и сумка. Прирост точности приходит, когда поверх ставится модель поведения и позы, а потом всё это коррелируется с исключениями POS.
1. YOLOv11 / YOLOv8 для детекции. Anchor-free, ~50–120 FPS на одном NVIDIA T4 на поток 1080p, устойчиво работает на мелких объектах (косметика, бритвы, детское питание — те категории, которые реально уносят). YOLOv11 (2024) и слой уточнения D-FINE дают более узкие bounding box для классификации сокрытия.
2. Модели позы и поведения (HRNet, OpenPose, MediaPipe BlazePose). Они классифицируют кинематику тела — рука внутрь куртки, рука в карман у полки с дорогим товаром, задержка с разворотом у SCO. Работают без распознавания лиц, что и есть правильный дефолт по соображениям комплаенса.
3. Модели аномалий для организованной преступности. Автоэнкодеры или контрастивные эмбеддинги учат «нормальную траекторию покупателя» в магазине и помечают отклонения: быстрые входы и выходы, разделение группы у полки, повторные визиты в разные дни. Меню моделей мы детально разбирали в гайде по детекции аномалий в видеонаблюдении.
4. Классификаторы исключений POS / SCO. Табличные модели на потоке транзакций отмечают no-sale, post-void, refund-after-close и item-mismatch. Соединённые с видео-событием по camera-id и метке времени, они поднимают precision истинных срабатываний с ~70% (только видео) до 90%+.
5. Сквозная переидентификация между магазинами. Эмбеддинги ReID (одежда + походка, никогда лицо) позволяют связать одного и того же преступника в нескольких магазинах сети — именно тот паттерн, который и определяет организованную преступность в рознице.
Берите поведение + POS-корреляцию (а не распознавание лиц), когда: у юристов есть хоть малейшее сомнение по BIPA, CCPA или GDPR. Вы потеряете ~5–8 процентных пунктов recall, но избежите штрафов, которые могут перекрыть годовой бюджет на платформу.
Сравнение вендоров: Verkada, Rhombus, Solink, Spot AI, Everseen
Если вы решили купить, реалистичный шорт-лист ниже покрывает ~80% среднего рынка. Цены — по публичным бенчмаркам и партнёрским предложениям 2024–2025; воспринимайте их как ориентир для планирования, а не закупочное предложение.
| Вендор | Модель железа | Корреляция с POS | За камеру / месяц* | Кому подходит |
|---|---|---|---|---|
| Verkada | Только проприетарные камеры | Ограниченная (через партнёров) | ~1 200–11 200 ₽ за лицензию + capex на камеры | Greenfield-разворачивания, где нужен один ответственный поставщик. |
| Rhombus | Свои + сторонние ONVIF | Хорошая | ~600–1 800 ₽ | Сети с фокусом на комплаенс; лучшая документация по BIPA / CCPA. |
| Solink | Bring-your-own камеры | Более 150 интеграций POS | ~200–900 ₽ | Существующий парк камер; QSR / convenience / аптеки. |
| Spot AI | Бесплатный NVR + bring-your-own камеры | Развивается | ~300–1 500 ₽ | Средний рынок; общие дашборды для операций и защиты от потерь. |
| Everseen | Любые камеры, корпоративный сегмент | Глубокая SCO / POS | Индивидуальные корпоративные цены | Tier-1 продуктовые сети с фокусом на мошенничество в SCO; FP-rate 2–5%. |
*Цена за камеру в месяц — оценка лицензии + облако / хранение, без стоимости самих камер и установки. Реальные предложения отличаются на ±30% в зависимости от количества камер и срока хранения.
Модель стоимости заказной разработки: сеть из 20 магазинов
Если вы решили разрабатывать, ниже наша оценка трёхлетней структуры затрат для сети из 20 магазинов с 10 камерами на магазин (всего 200 камер), 90-дневным горячим хранением, гибридной архитектурой с edge-шлюзами и резидентностью данных в ЕС и США. Цифры рассчитаны для нашего пайплайна Agent Engineering и senior-команды: один тимлид, два backend-инженера, ML-инженер на 50%, frontend-инженер и DevOps-лид.
| Направление | Год 1 (разработка) | Годы 2–3 (эксплуатация / итерации) | Заметки |
|---|---|---|---|
| Архитектура, исследование, комплаенс | 3,3–5,2 млн ₽ | 1,1 млн ₽ / год | Включая ревью BIPA / CCPA / GDPR. |
| Backend (ингест, API, мульти-тенант) | 10–13 млн ₽ | 4,5 млн ₽ / год | Go / Python; обёртка над MediaMTX. |
| Софт edge-шлюзов | 5,2–7,1 млн ₽ | 2,2 млн ₽ / год | YOLOv11 + поведенческая модель на Jetson Orin Nano. |
| Веб-консоль защиты от потерь + мобильные оповещения | 6–8,2 млн ₽ | 3 млн ₽ / год | React + LL-HLS, push на iOS / Android. |
| ML-пайплайн + переобучение | 4,1–6 млн ₽ | 2,6 млн ₽ / год | Разметка, A/B, детекция дрейфа. |
| QA, безопасность, пентест | 3,3–4,8 млн ₽ | 1,8 млн ₽ / год | Готовность к SOC 2; ежегодный аудит. |
| Облачная инфраструктура (compute, хранение, egress) | 1,8–3,3 млн ₽ | 4,5–8,2 млн ₽ / год | Микс Hetzner AX + R2 / S3, чтобы держать egress под контролем. |
| Типичные итоги по годам | ~39–48 млн ₽ | ~21–24 млн ₽ / год | Железо (шлюзы + камеры) считается отдельно. |
Полная стоимость заказной платформы такого формата за три года обычно укладывается в 82–97 млн ₽ — в зависимости от того, насколько консоль защиты от потерь остаётся заказной, а насколько переиспользует open-source решения вроде Frigate. Managed VSaaS той же конфигурации обойдётся в 52–75 млн ₽ за тот же период. Поэтому разработка имеет смысл, только когда нужны процессы, которых вендоры не продают: проприетарный POS, интеграции с системами управления складом или персоналом, white-label под франчайзи и так далее.
Нужна обоснованная модель затрат до закупки?
Мы рассчитаем линию «разрабатывать или купить» под точное число ваших магазинов, политику хранения и POS-стек, и пришлём одностраничник, который вы покажете финансовому директору.
Хранение и срок хранения: тихий убийца бюджета
На маркетинговой странице хранение выглядит дёшево, а в счёте AWS — некрасиво. Поток 1080p H.264 при 15 FPS даёт ~150–300 ГБ на камеру в месяц. На 200 камерах и сроке хранения 90 дней вы держите примерно 90–180 ТБ горячих данных и 45–90 ТБ трафика в месяц.
Реально работают три рычага:
1. Многоуровневое хранение. Горячий S3 / R2 на 7–14 дней, infrequent-access на 30–90 дней, glacier-класс — только под legal-hold. Мы видели, как это срезает расходы на хранение на 55–70%.
2. Загрузка в облако только событий. Отправляйте 30-секундные ролики «до и после» события, а не сырые потоки 24/7. Полную запись — только по флагу расследования.
3. Cloudflare R2 или self-hosted на линейке Hetzner AX. Egress на R2 — нулевой, на AWS — 3,7–6,7 ₽ / ГБ. Для хранилищ доказательств, которые тянут юристы и полиция, разница даёт пятизначные суммы (в ₽) экономии за квартал.
Комплаенс: BIPA, CCPA, GDPR, SOC 2, PCI-DSS
Если вы продаёте в США и ЕС, ваша платформа должна соответствовать минимум четырём пересекающимся регуляциям. Штрафы достаточно велики, чтобы перекрыть годовой бюджет на платформу, поэтому мы относимся к комплаенсу как к архитектурному ограничению, а не пункту чек-листа.
| Регуляция | Ключевое требование | Минимум штрафа | Влияние на архитектуру |
|---|---|---|---|
| Иллинойс — BIPA | Письменное согласие на биометрию | 75 тыс. ₽ (по неосторожности) / 375 тыс. ₽ (умысел) за запись | Избегать эмбеддингов лиц / радужки; использовать позу / поведение. |
| Калифорния — CCPA / CPRA | Право доступа и удаления для потребителей | До 562 тыс. ₽ за нарушение | API удаления; инвентаризация данных; информационные таблички. |
| ЕС — GDPR | Законное основание + DSAR | €20 млн или 4% мировой выручки | Хранение в ЕС; DPA с подрядчиками; PIA на каждый use case. |
| SOC 2 Type II | Документированные контроли + аудит | Потерянные корпоративные сделки | Централизованное логирование, IAM, контроль изменений. |
| PCI-DSS (соседство с POS) | Токенизированный PAN, сегментированная сеть | Штрафы эквайера; потеря мерчант-сертификата | Никогда не хранить сырой номер карты; изолировать VLAN. |
Две практические эвристики. Первая: если задачу защиты от потерь можно решить без распознавания лиц — решайте без него. Риск по BIPA / GDPR из-за «у нас лежат биометрические шаблоны» редко стоит 5–8 процентных пунктов recall. Вторая: резидентность данных в ЕС не обсуждается. Поднимите отдельный стек во Франкфурте или Дублине (Hetzner AX + R2), чтобы видео из EU-магазинов никогда не попадало в US-бакет.
Мини-кейс: уроки V.A.L.T., применимые к рознице
V.A.L.T. — не розничная платформа: она обслуживает правоохранительные органы, центры защиты прав детей и обучение клиническим навыкам. Но операционно она устроена так же, как масштабный розничный VSaaS: тысячи камер, доказательственные записи, мульти-тенантная организационная структура, тонкое управление доступом. Три урока переносятся напрямую:
Ситуация. Когда V.A.L.T. перешагнул порог в ~1 500 камер и ~15 000 ежедневных пользователей, исходный cloud-only пайплайн ингеста начал захлёбываться на пиковых записях с нескольких камер во время плановых интервью, а задержка экспорта аудита прыгнула с 30 секунд до 4 минут.
План. За 12-недельный спринт мы (1) ввели edge-буферизацию на пер-сайтовом устройстве, (2) перевели хранилище доказательств на многоуровневую раскладку hot / warm / cold, (3) переписали пайплайн экспорта как очередь задач с чанками, связанными цепочкой хешей, и (4) добавили SLO-доску на Prometheus / Grafana, которой полностью владеет операционная команда.
Результат. Средняя задержка экспорта упала с 240 секунд до 28, отказы при выгрузке доказательств — с 0,9% до менее 0,05%, а расходы на хранение мы удержали примерно на одном уровне при 60% росте парка камер. Сейчас платформа на этой же архитектуре обслуживает более 700 организаций и 25 000 ежедневных пользователей.
Хотите аналогичный диагностический разбор вашего VSaaS или внутренней системы видеонаблюдения? Свяжитесь с нами — 30-минутный архитектурный разбор, и мы вернёмся с одностраничной картой проблем.
Корреляция с POS: главный рычаг точности
Команды защиты от потерь регулярно говорят нам, что игнорируют 60–80% оповещений, основанных только на видео. Решение — не более «умная» видеомодель, а корреляция видеопотока с шиной событий POS / SCO так, чтобы у каждого оповещения был транзакционный повод для разбора.
Паттерн, который работает в продакшене:
Рисунок 2. Минимальное правило корреляции видео-события с исключением POS.
После того как такое объединение приземляется, очередь защиты от потерь превращается в один экран высокоточных кейсов на смену вместо стены низкоконфидентных движений. Solink построил бизнес стоимостью более 15 млрд ₽ практически на одном этом инсайте; мы видели, как процент разбора оповещений на одном и том же парке камер прыгал с ~30% до 80%+ сразу после подключения.
Фреймворк решения: разрабатывать или купить — пять вопросов
1. Сколько магазинов будет работать с системой за 36 месяцев? До ~75 магазинов TCO почти всегда выигрывают вендоры. Свыше ~150 магазинов амортизация заказной разработки на магазин начинает доминировать.
2. Ваш стек POS / SCO — стандартный или проприетарный? Если у вас NCR, Toshiba, Square или Lightspeed — вендоры уже интегрированы. Если у вас собственный или сильно кастомизированный POS — выигрывает разработка.
3. Вам нужно вмешательство в реальном времени (оповещение <1 с) или разбор после инцидента (<1 ч)? Реальное время требует WebRTC и инференса на edge; некоторые вендоры не поддерживают это без дорогих опций.
4. Где будут лежать данные? Если вы работаете в ЕС или у вас единственный крупный корпоративный клиент с жёсткими требованиями к резидентности данных, мульти-региональная заказная сборка часто дешевле, чем «прикручивать» региональные ограничения к решению вендора.
5. Можете ли вы финансировать команду из 2–3 инженеров минимум на три года? Если нет — не начинайте разработку: платформа сгниёт в момент, когда исходная команда разойдётся.
Берите разработку, когда: три или больше вопросов выше указывают в сторону заказного решения — особенно если интеграция с POS или процессом нестандартная. В остальных случаях сначала запустите вендорский пилот и пересмотрите решение через 12 месяцев.
Пять ошибок, которые мы регулярно исправляем
1. Подгонка частоты ложных срабатываний к нулю. Порог 0% FP даёт вам и 60–70% true-positive. Целиться надо в 3–5% FP, >92% TP и подключать первичный человеческий разбор как уровень-1.
2. Пропуск выезда на объекты. Контровый свет на стеклянных дверях, зеркала на SCO, неверное фокусное расстояние на «рыбьем глазу» — всё это убивает работу модели, какие бы веса вы ни взяли. Обойдите каждый магазин до того, как поедут камеры.
3. Откладывание интеграции с POS «на следующую фазу». Без корреляции платформа — это дорогой детектор движения. Включайте объединение POS / SCO в MVP.
4. Edge-инференс без облачного фейловера. Шлюз умирает в пятницу вечером, записи исчезают, а в понедельник прокурор просит ролик, которого больше нет. Всегда — локальная очередь плюс репликация в облако.
5. Выпуск новой модели без пути отката. Держите три версии модели (prod, canary, experimental), A/B на 10% камер в течение недели и автоматический откат при падении precision на >3 пункта.
KPI, по которым видно, работает ли платформа
KPI качества. True-positive (recall) >92%, precision (1−FP) >95%, F1 >0,93, end-to-end задержка оповещения <5 секунд. Это честный табель модели; отслеживайте по камере, по магазину, по версии модели.
Бизнес-KPI. Снижение потерь на 15–30% за 12 месяцев, доля разобранных оповещений >80%, среднее время расследования <15 минут, окупаемость за 90–180 дней. Если потери не двигаются — платформа работает на показ; либо отключайте, либо чините процесс защиты от потерь.
KPI надёжности. Аптайм облака ≥99,9%, доступность шлюза ≥99,5% по магазину, целостность видео — 0% bit-rot (S3-чексуммы + ежемесячная валидация), задержка доставки оповещения <30 секунд end-to-end. Без этого ваши доказательства можно оспорить в суде.
Когда НЕ стоит делать заказную видеоплатформу
Есть пять ситуаций, когда мы говорим клиенту «не разрабатывайте», даже если охотно взяли бы заказ:
1. У вас меньше 50 магазинов и нет планов перерасти 100. Математика на магазин не сходится; готовый VSaaS обойдётся в два раза дешевле заказной разработки за три года.
2. Вам надо запуститься за <90 дней. Пилот Solink или Spot AI поднимается за 4–8 недель; обоснованный заказной MVP — за 12–16.
3. У вас нет владельца продукта или внутреннего чемпиона по защите от потерь, который проживёт с системой два года. Заказные платформы умирают без внутреннего спонсора.
4. Требования по комплаенсу типовые, а POS — массовый. Покупка просто дешевле.
5. У вас нет операционного бюджета на годы вперёд. Платформа, которая запустилась и потом голодает на сопровождении, хуже, чем её отсутствие — она генерирует доказательства, которые вы не сможете защитить.
Реалистичный план запуска за 16 недель
Для пилота на 20 магазинов мы используем такую каденцию в связке с пайплайном Agent Engineering. Она сжимает обычно 5–6-месячную разработку до ~16 недель, потому что большая часть бойлерплейта (auth, мульти-тенант, журнал аудита, IaC) генерируется и проходит ревью, а не пишется руками.
| Фаза | Недели | Результат |
|---|---|---|
| Исследование и выезд на объекты | 1–2 | Аудит камер; описание процесса защиты от потерь; объём комплаенса. |
| Архитектура и IaC | 3–4 | Стэки на Terraform / Pulumi; скелет ингеста. |
| Edge-шлюз и приём RTSP | 3–6 | Образы Jetson; baseline на YOLOv11. |
| Корреляция с POS | 5–8 | Адаптеры под три ведущих POS / SCO; объединение оповещений. |
| Консоль защиты от потерь и мобильное приложение | 7–12 | React + LL-HLS, push-уведомления. |
| Пилот в 3–5 магазинах | 10–13 | Подбор порогов; обучение команды защиты от потерь. |
| Закаливание и комплаенс | 13–15 | Контроли SOC 2; пентест; PIA. |
| Полное развёртывание на 20 магазинов | 15–16 | Поэтапный переход; раннбук поддержки 24/7. |
Интеграции, которые отрабатывают вложения
Розничный VSaaS становится полезнее, когда общается с системами, в которых уже живут ваши операторы. Шорт-лист интеграций, которые мы выпускаем на первой неделе, а не «во второй фазе»:
Шина событий POS / SCO. NCR Voyix, Toshiba TCx, Square, Lightspeed, Oracle Simphony — закройте свои топ-3, для остальных дайте универсальный webhook.
Контроль доступа. Genetec, Brivo, Openpath / Avigilon Alta, Kisi — корреляция движения после закрытия с проходами по карте.
Подсчёт людей. Либо встроить (дешевле, точность ниже), либо подключить мост к V-Count / FootfallCam / Hella Aglaia (точнее, ~15 000–37 500 ₽ за сенсор).
Тикеты. Jira, ServiceNow, Zendesk — создать тикет расследования из любого оповещения с уже встроенной ссылкой на ролик.
Аналитический склад. BigQuery, Snowflake, Redshift — отгружайте суточные агрегаты команде BI, чтобы потери оказались на одном дашборде с продажами в сравнимых магазинах.
Защита: платформа — это ещё и поверхность атаки
Облачные видеоплатформы уже компрометировали в масштабе — взлом Verkada в 2021 году открыл доступ к 150 000 камер на заводах, в школах и больницах. Мы зашиваем в каждое развёртывание пять контролей:
1. mTLS между камерами и шлюзом, между шлюзом и облаком. Никакого неаутентифицированного RTSP. Никогда.
2. Хранение учётных данных на железе. Используйте secure-boot Jetson + TPM или его аналог на шлюзе. Никаких API-ключей открытым текстом на диске.
3. Поарендаторное шифрование с разными ключами на уровне строк. Утечка данных одного франчайзи не должна открывать доступ к остальной сети.
4. Just-in-time доступ для инженеров. Никакого постоянного prod-доступа; каждая сессия идёт по тикету, логируется и автоматически истекает.
5. Ежеквартальные red-team учения. Внутренние или с внешним подрядчиком. Их стоимость — ошибка округления по сравнению с одним взломом.
Нужен 30-минутный security-разбор плана VSaaS?
Пройдём по вашей текущей архитектуре, отметим три главных вектора взлома и скажем, что починить в первые 30 дней.
Как Agent Engineering меняет экономику разработки
Три года назад заказная VSaaS на 20 магазинов комфортно перешагивала за 112 млн ₽ в первый год. Сегодня, при связке генерации кода мультиагентами и архитектурного ревью senior-инженеров, тот же объём укладывается в показанный выше диапазон 39–48 млн ₽. Экономия концентрируется в нескольких конкретных местах:
Генерация бойлерплейта. CRUD API, мульти-тенантный каркас, IaC-модули, схема RBAC — агенты выдают ~70% первого черновика, senior-инженеры рефакторят и закаляют.
Каркас тестов. Генерируемые юнит- и интеграционные тесты покрывают happy-path; люди добавляют отказы, которые реально случаются в продакшене.
Документация в синхронизации с кодом. Спецификация, OpenAPI, раннбук — из одного источника правды, поэтому при передаче команде защиты от потерь они получают актуальные доки, а не вики, отстающую на полгода.
В архитектуре это ничего критичного не меняет: senior-команда всё равно нужна для проектирования протоколов, ML-пайплайна и модели безопасности. Но 4–6 недель из обычного 16–20-недельного пилота этот подход стабильно срезает.
FAQ
Нужно ли менять существующие IP-камеры, чтобы получить AI-защиту от потерь?
Нет, в большинстве случаев. Solink, Spot AI, Rhombus и заказная разработка одинаково умеют принимать RTSP / ONVIF из вашего парка. Вы экономите 60–70% capex по сравнению с полной заменой в стиле Verkada. Меняйте камеры только там, где оптика физически не подходит (низкое разрешение, плохой угол, нет IR) под нужный AI-сценарий.
Насколько точно AI ловит магазинных воров в реальности, а не на демо вендора?
Лучшие в классе вендоры (Everseen, Veesion) показывают 92–98% true-positive в контролируемых исследованиях. В реальных магазинах получается 85–92% при 2–8% ложных срабатываний — в зависимости от освещения, перекрытий и плотности толпы. Наш плановый baseline — 90% TP при 5% FP, плюс первичная очередь человеческого разбора, превращающая остаточный шум в надёжные кейсы.
Можно ли нарваться на юридические проблемы из-за распознавания лиц?
Можно. BIPA в Иллинойсе (75 тыс.–375 тыс. ₽ за запись), CCPA в Калифорнии (до 562 тыс. ₽ за нарушение) и GDPR в ЕС (€20 млн или 4% выручки) делают распознавание лиц дорогим в правильной реализации. Прагматичный выбор для розничной защиты от потерь — опираться на позу тела, походку, поведение сокрытия и POS-корреляцию. Распознавание лиц оставьте для списков известных нарушителей с явным письменным согласием и агрессивными политиками удаления.
Как быстро можно поднять пилот на 20 магазинов?
Готовые вендоры (Solink, Spot AI, Rhombus) могут запуститься за 4–8 недель, если ваша сеть в порядке. Заказная разработка с пайплайном Agent Engineering — 14–16 недель до MVP, 22–26 недель до закалённой системы, готовой к SOC 2. Обычно мы рекомендуем сначала вендорский пилот; на заказную разработку переходить, когда окупаемость и пробелы в интеграциях это оправдывают.
Какую окупаемость ждать и за какой срок?
Удачные внедрения окупаются за 90–180 дней. Типичный эффект: снижение потерь на 15–30% за 12 месяцев, сокращение времени расследования на 50–70% и измеримое снижение усталости от оповещений после подключения POS-корреляции. Если за первый квартал движения нет — остановите добавление камер и почините процесс защиты от потерь.
Edge-инференс или только облако — что выбрать?
Чистое облако нормально для пилота на один магазин или меньше ~15 камер. Дальше гибрид выигрывает на каждом измерении: edge даёт оповещения с задержкой <50 мс и экономит 70–90% трафика; облако отвечает за долговременное хранение, поиск паттернов организованной преступности и переобучение. Чистое облако для сетей крупнее 5–10 магазинов мы рекомендуем редко.
Как не дать команде защиты от потерь утонуть в оповещениях?
Три правила. (1) Эшелонируйте оповещения: critical, medium, info; будите людей только critical. (2) Требуйте корреляцию POS / SCO для оповещений уровня 1, чтобы у аналитика был транзакционный повод смотреть. (3) Считайте долю разобранных оповещений как KPI первого ряда; если она падает ниже 50% две недели подряд — поднимайте пороги модели или отключайте самые шумные правила.
Как Фора Софт обычно заходит в проект такого формата?
60-минутное исследование, затем оплачиваемый двухнедельный архитектурный спринт, в результате которого получаются целевая архитектура, модель затрат и 16-недельная дорожная карта. Дальше — MVP с фиксированным объёмом (12–16 недель), мягкий запуск в 3–5 магазинах и поэтапное развёртывание. Мы можем также подключиться как «второе мнение» на ревью существующей разработки или оценки вендора, если вы сейчас на этом этапе. Свяжитесь с нами, чтобы обсудить рамки.
Что почитать дальше
Аналитика
Видеоаналитика в рознице: гайд 2025
Подсчёт людей, тепловые карты и управление очередями на одном VSaaS-стеке.
AI
AI и детекция аномалий в видеонаблюдении
Поведенческие модели, контроль ложных срабатываний, проектирование оповещений.
Архитектура
Масштабируемые системы управления видео в 2026
Пять инженерных решений, которые определяют, масштабируется ли ваша VMS.
Гайд по разработке
Заказная разработка VMS: полный гайд
Сборка системы управления видео с нуля — команды, стек, стоимость.
Инженерия
Обработка видео в реальном времени с AI: лучшие практики
Edge-инференс, бюджеты задержки и связка OpenCV / FFmpeg.
Готовы выпустить розничный VSaaS, который реально снижает потери?
Современная облачная видеоплатформа в рознице — больше не игрушка для службы безопасности. Это измеримый вклад в валовую маржу с окупаемостью за 90–180 дней при грамотном внедрении. Архитектура сошлась на гибриде edge–cloud с приёмом по RTSP, отдачей через LL-HLS / WebRTC, моделями YOLOv11 поверх головы по позе и поведению и плотной корреляцией с POS. Вендоры зрелые, и можно покупать, если математика сходится; современные инженерные практики опустили стоимость заказной разработки достаточно, чтобы сети от 100 магазинов и франчайзинговые сети рассмотрели хотя бы оба пути.
Если вы тот, на кого повесили потери, мошенничество или модернизацию защиты от потерь, вам нужна не очередная общая презентация. Вам нужна линия «разрабатывать или купить», проведённая по числу ваших магазинов, вашему POS, вашим юрисдикциям и операционному бюджету. Мы принесём архитектуру, модель затрат и 21 год опыта V.A.L.T. и нашей более широкой инженерии видеонаблюдения.
Получите вердикт «разрабатывать или купить» за 30 минут
Принесите количество магазинов, POS-стек и текущий парк камер. Мы вернёмся с эскизом архитектуры, моделью затрат и честной рекомендацией.

