Масштабируемая система видеонаблюдения с распределённой архитектурой, облачным хранилищем и многоузловой инфраструктурой

Масштабировать систему видеонаблюдения (video management system, VMS) со 100 до 10 000 камер — это не «то же самое, только больше», это другая архитектура. В 2026 году ключевых решений пять: приём потоков, тиринг хранения, распределение вычислений между edge и облаком, стратегия транскодинга и политика автоскейлинга. Если эти пять решений приняты верно, всё остальное — наблюдаемость, соответствие требованиям, стоимость — складывается само. Ошибётесь хотя бы в одном — система ляжет в тот день, когда вы пересечёте отметку в 500 одновременных потоков.

Горизонтальная масштабируемость VMS в 2026 году означает: микросервисы, запись на edge, поддержку смешанных кодеков AV1/H.265 и 10 000+ камер на кластер. Milestone XProtect, Genetec Security Center 5.12+ и Eagle Eye Networks — три эталонных решения, которые предлагают такую функциональность по цене, не требующей индивидуального RFP.

Главное

  • Пять инженерных решений: набор протоколов приёма, тиринг хранения (горячий/тёплый/холодный), распределение инференса между edge и облаком, путь работы с кодеками и транскодингом, политика триггеров автоскейлинга.
  • Переход с монолита на микросервисы перестаёт быть опциональным начиная с 1 000+ потоков. Независимое масштабирование сервисов приёма, хранения, аналитики и пользовательского контура — минимальная жизнеспособная архитектура.
  • Гибрид edge + облако — стандарт 2026 года: инференс на камере плюс агрегация в облаке выигрывает у чистого облака по стоимости трафика и у чистого edge — по глубине аналитики.
  • Стоимость хранения удваивается каждые 18 месяцев глубины архива. Тированное объектное хранилище класса S3 с автоматическим повышением приоритета по событиям — единственная устойчивая модель на больших объёмах.
  • Наблюдаемость до масштаба, а не после. Метрики, трейсы и синтетические проверки здоровья должны быть подключены до отметки в 500 потоков — после неё вы будете отлаживать вслепую.

Почему этот гид написала Фора Софт

Компания Фора Софт занимается системами видеонаблюдения с 2005 года. Одна из них — V.A.L.T. — сейчас обслуживает 650+ организаций в США (полицейские департаменты, университеты, клиники поведенческой медицины) с 25 000+ ежедневных пользователей и тысячами одновременных потоков с камер. Этот гид — дистиллированный опыт того, что мы узнали, проводя V.A.L.T. и другие VMS-платформы через переходы 0 → 1 000 камер и 1 000 → 10 000 камер. Описанные ниже сценарии отказов мы отлаживали в три часа ночи, а не читали о них в чужих статьях.

Облачная архитектура нужна, когда: у вас > 50 камер или несколько площадок. Гибрид edge + облако обходит чистый NVR.

Планируете VMS-платформу?

Мы проектируем и запускаем продакшен-архитектуры VMS, которые масштабируются от 100 до 10 000+ камер.

Расскажите целевой масштаб, регион требований и состав камер. Мы вернёмся с эталонной архитектурой и поэтапным планом запуска за один созвон.

Позвоните нам → Напишите нам →

Решение 1 — Набор протоколов приёма

Каждая камера и каждый поток в вашей VMS говорят на одном из четырёх протоколов. Поддержка всех четырёх нативно — базовый минимум; правильный выбор протокола по умолчанию для новых подключений — это уже рычаг.

Протокол Задержка Подходит для На что обратить внимание
RTSP ~200–500 мс Старые IP-камеры, развёртывания в LAN Сложности с NAT, нет встроенной аутентификации
WebRTC ~80–200 мс Живой мониторинг, дашборды операторов Сложная эксплуатация SFU на масштабе
LL-HLS / DASH ~2–4 с Раздача публичной аудитории через CDN Не подходит для интерактивного управления
SRT / RTMP ~1–3 с Подача контента, удалённые камеры Нет нативной поддержки в браузерах (RTMP отключён в Chrome)

Наш дефолт 2026 года для VMS с нуля: WebRTC для живого просмотра оператором, LL-HLS для раздачи на публичную аудиторию, RTSP для приёма со старых камер, SRT для подачи с удалённых точек. Пропускайте все четыре через единый медиасервер (Flussonic, Wowza или собственное решение на Pion + Go), который выполняет нормализацию протоколов и переупаковку на выходе. Не пытайтесь выбрать один протокол — производители камер и зрительские приложения всё равно вынудят вас поддерживать все.

Решение 2 — Тиринг хранения

Хранение составляет 40–60 % совокупной стоимости владения VMS на больших объёмах. Самая частая ошибка, которую мы видим: всё записывают на горячее хранилище с полным битрейтом «на всякий случай» и через полгода упираются в обрыв глубины архива, когда счёт за месяц удваивается.

Откажитесь от закрытых экосистем: ONVIF + RTSP больше не обсуждаются. Vendor lock-in в 2026 году — это красный флаг для закупок.

01

Горячий тир — последние 7 дней

Объектное хранилище на SSD (S3 Standard, GCS Standard) или локальные NVMe для on-prem. Полный битрейт, индексация по событиям и времени. Задержка извлечения — до 100 мс. Здесь происходит живой просмотр и реакция на инциденты.

02

Тёплый тир — с 8 по 90 день

S3 Infrequent Access или GCS Nearline. Перекодировка в более низкий битрейт (обычно 30–40 % от горячего), если регулятор не требует сохранять полное качество. Задержка извлечения — секунды, а не миллисекунды. Помеченные событиями фрагменты по запросу повышаются обратно до горячего тира.

03

Холодный тир — старше 90 дней

S3 Glacier Instant или Glacier Flexible Retrieval. Архив уровня соответствия (HIPAA, GDPR, CJIS) без стоимости горячего тира. Извлечение — от 1 до 12 часов, оплачивается отдельно. На большинстве VMS-нагрузок 90 % данных после 90 дней живут именно здесь.

04

Повышение тира по событию

AI-детектирование аномалий, ручные закладки и отчёты об инцидентах автоматически повышают соответствующие временные окна обратно в горячее хранилище. Именно это и делает тиринг совместимым с расследовательскими сценариями — операторы не ждут извлечения из холодного тира по флагу события.

Ориентировочная математика стоимости: один поток 1080p при 2 Мбит/с потребляет ~22 ГБ/сут. На 1 000 камер и 90 дней горячего архива это ~1,98 ПБ. На AWS S3 Standard по 1,72 ₽/ГБ в месяц это около 3,3 млн ₽/мес только за хранение. Если перевести те же данные на схему 7/83 дней горячий/тёплый при 30 % битрейта на тёплом, счёт падает до ~1 млн ₽/мес. За год одно это решение даёт экономию примерно 27 млн ₽.

Решение 3 — Распределение вычислений между edge и облаком

Место, где выполняется инференс — на камере, на edge-устройстве или в облаке, — это главный фактор стоимости трафика и задержки аналитики.

Где выполняется Задержка Трафик Потолок модели
На камере <50 мс Минимальный (только метаданные) YOLOv8-nano, класса MobileNet
Edge-устройство (локально) 100–300 мс Низкий (только LAN) YOLOv8-medium, ResNet, Whisper
Региональное облако 500 мс–2 с Высокий (полная загрузка потока) Любая — VLM, большие диффузионные модели

Выигрывающая схема 2026 года: edge-first с эскалацией в облако. Модели на камере фильтруют 99 % кадров (движение, базовый класс объектов). На edge-устройствах работают модели среднего размера для всего, что было помечено. И только клипы целиком с низкой уверенностью эскалируются в облачную VLM для глубокого анализа. Это сокращает исходящий трафик на 90–95 % по сравнению с наивным пайплайном «загружаем всё» и при этом сохраняет доступ к самой глубокой аналитике.

Подвох

Не полагайтесь на встроенный AI камер, если вам нужны обновления модели. Большинство камер выходят с замороженным чипом инференса, и переобучить их на своих данных нельзя. Чтобы получить ощутимый эффект от AI, запускайте инференс на edge-устройстве вашего контроля — Jetson или коробке с OpenVINO, — даже если у камер уже есть AI. Воспринимайте AI на стороне камеры как бесплатный бонус, а не как основной аналитический слой.

Решение 4 — Стратегия по кодекам и транскодингу

Транскодинг — это место, где VMS-системы тихо съедают неограниченные вычисления. Чтобы держать его в рамках, достаточно двух правил:

Приоритеты AI-аналитики: сначала детекция объектов, потом флаги аномалий, затем поиск по атрибутам — это срезает операционные расходы более чем на 50 %.

Правило 1 — Запишите один раз, транскодируйте по запросу

Храните оригинальный кодек камеры (как правило, H.264 или H.265) на исходном битрейте. Варианты с пониженным разрешением генерируйте только тогда, когда конкретный зритель их запросил, и кэшируйте на короткое окно. Заранее собирать полную ABR-лестницу для каждой камеры — кратчайший путь к шестизначному счёту за вычисления в месяц на масштабе.

Правило 2 — Разгружайте через аппаратные кодировщики

NVIDIA NVENC, Intel Quick Sync и Apple VideoToolbox дают пропускную способность в 10–30× выше, чем CPU x264, при приемлемом качестве. На AWS одна машина g5.2xlarge тянет 30–50 одновременных живых транскодов, для которых на CPU потребовалась бы c5.12xlarge. Закладывайте это в бюджет как первоклассную статью капитальных или операционных затрат, а не «по остаточному принципу».

AV1 готов — сначала для холодного тира

Аппаратное кодирование AV1 (NVIDIA Ada, Intel Arc Battlemage, AMD RDNA4) теперь работает в реальном времени. AV1 даёт 30–40 % экономии битрейта по сравнению с H.265 при том же качестве — огромный плюс для VMS-нагрузок, где доминирует хранение. Ход 2026 года: транскодировать клипы тёплого и холодного тира в AV1 при ротации после приёма. Горячий тир оставляйте в H.264/H.265 для совместимости декодирования со старыми клиентскими устройствами.

Решение 5 — Политика триггеров автоскейлинга

VMS-нагрузки по своей природе скачкообразны: разборы в конце смены, реакция на инциденты, плановые выгрузки из архива. Автоскейлинг по CPU здесь слишком медленный. Лучше работают два других триггера:

Триггер A — Количество потоков на медиа-узел

Когда любой медиасервер пересекает 80 % валидированной нагрузочными тестами ёмкости в потоках на узел, поднимайте новый узел и направляйте новые подключения на него. Реакция — десятки секунд, а не минуты.

Триггер B — Глубина очереди на воркерах транскодинга

Вместо CPU воркера (запаздывающий показатель) следите за бэклогом заданий транскодинга. Когда глубина очереди превышает типичное окно обработки в 5 минут, масштабируйте воркеров горизонтально. Когда она 15+ минут держится ниже спокойного порога, скейльте вниз.

Сочетайте это со spot/preemptible-инстансами для stateless-воркеров транскодинга (могут умереть посреди задания — очередь повторно поставит его в работу) и зарезервированными инстансами для медиасерверов (stateful, мигрировать дорого). Типичная экономия: 40–60 % на вычислениях транскодинга по сравнению с полностью on-demand.

Не уверены, что из этого применимо к вам?

Мы проверим вашу текущую или планируемую архитектуру по этим пяти решениям.

Поделитесь целевым масштабом и ограничениями. На выходе — одностраничный gap-анализ и приоритизированный список исправлений. Без обязательств.

Позвоните нам → Напишите нам →

Декомпозиция на микросервисы, которая работает

После ~500 одновременных потоков монолитная VMS превращается в риск выкатки — один неудачный релиз одновременно блокирует живой мониторинг, хранение и управление пользователями. Декомпозиция, которую мы запускаем чаще всего:

Частый сценарий отказа: игнорировать стратегию хранения. Умная политика глубины архива сокращает расходы на хранение на 60–80 %.

Сервис Ответственность Ось масштабирования
Приём Принимает RTSP/WebRTC/SRT, нормализует во внутренний формат Количество потоков
Медиа-роутер (SFU) Маршрутизирует живые потоки операторским клиентам Одновременные зрители
Writer хранилища Нарезает на чанки, шифрует, пишет в объектное хранилище ГБ/с приёма
Воркер транскодинга Варианты пониженного разрешения, конверсия в AV1 для тёплого тира Глубина очереди
Аналитика Запускает AI-инференс, эмитит события Кадров в секунду
Метаданные / поиск Индексирует события, клипы, закладки; обслуживает поисковые запросы QPS запросов
Идентификация / RBAC Аутентификация, авторизация, мультитенантная изоляция Количество пользовательских сессий
Уведомления Алёрты в реальном времени в операторские UI, на почту, в вебхуки Событий в секунду

У каждого сервиса своя ось масштабирования, своя база данных (или шард БД) и свой темп деплоев. Зона поражения от неудачного релиза воркера транскодинга больше не валит живой мониторинг. Kubernetes плюс service mesh (Istio, Linkerd) плюс событийный стриминг (Kafka или NATS JetStream) — типовая платформенная подложка 2026 года.

Кейс: V.A.L.T. — архитектура пяти решений в 650+ организациях

V.A.L.T. — платформа видеонаблюдения Фора Софт, которой пользуются более 650 организаций в США: полицейские департаменты, университеты, медицинские учреждения и клиники поведенческой медицины. Применяется для записи допросов, разбора тренингов и сценариев клинического супервайзинга. Платформа обслуживает 25 000+ ежедневных пользователей и тысячи одновременных потоков с камер.

Как пять решений реализованы в V.A.L.T.:

  • Набор протоколов приёма: RTSP + ONVIF для камер, WebRTC для живого просмотра оператором, SRT для удалённых комнат подачи.
  • Тиринг хранения: 7 дней горячий / 83 дня тёплый / 7 лет холодный для записей допросов под требования CJIS и HIPAA. Повышение по событию проброшено в UI управления делами.
  • Edge/облако: edge-устройства уровня комнаты обрабатывают детекцию движения и трекинг участников; облако отвечает за транскрипцию, диаризацию говорящих и сквозной поиск по делам.
  • Транскодинг: H.264 с ускорением NVENC для живого воспроизведения, конверсия в AV1 при ротации в тёплый тир — экономия хранения ~35 %.
  • Автоскейлинг: триггеры по количеству потоков для медиа-узлов; триггеры по глубине очереди для воркеров транскодинга; смешанный парк reserved + spot.

Платформа работает с доступностью 99,95 % и живой задержкой менее 200 мс по регионам США. Подключение новой организации — часто с 50–500 камер — это операция провижининга в течение одного дня, а не отдельный проект развёртывания.

Наблюдаемость до масштаба, а не после

Самые болезненные провалы VMS-масштабирования, которые мы отлаживали, объединяет одно: наблюдаемость прикручивали постфактум, когда система уже забуксовала, а не закладывали в дизайн. Четыре телеметрических поверхности, которые должны существовать до отметки в 500 одновременных потоков:

  • Метрики здоровья по каждому потоку (принятые кадры, доставленный битрейт, потери пакетов, задержка публикации сегмента) — как временные ряды в Prometheus с лейблами по камерам.
  • Сквозные trace ID, которые идут с кадром от приёма через транскодинг до записи в хранилище. OpenTelemetry с частотой семплирования, которую можно поднять до 100 % на время расследования.
  • Синтетические проверки, которые непрерывно тянут эталонный поток из каждого региона и валидируют задержку воспроизведения, разрешение и целостность декодирования. Они ловят тихие отказы, по которым ещё ни один оператор не открыл тикет.
  • Шаблоны доступа к хранилищу — какие временные диапазоны, какие камеры, какие пользователи обращаются к горячему, тёплому и холодному тиру. Это то, что позволяет ежеквартально перенастраивать политику тиринга по мере изменения нагрузки.

Соответствие требованиям — это архитектурное ограничение, а не чек-лист

HIPAA, GDPR, CJIS и отраслевые регуляторы (FERPA для образования, PCI для ритейла) влияют на архитектуру VMS, а не только на политики. Повторяющиеся требования: шифрование при передаче (TLS 1.3) и в покое (AES-256-GCM с ключами, которыми управляет клиент), хранилище, привязанное к региону (данные EU не покидают EU), неизменяемость аудит-логов (append-only с криптографической пломбой) и RBAC, способный гранулярно ограничивать права вплоть до камеры и временного окна по принципу минимальных привилегий.

Два архитектурных паттерна, которые стоит закладывать с первого дня: (1) пер-тенантные ключи шифрования в KMS — чтобы взлом данных одного клиента не каскадировал на остальных; (2) регионально-зависимая маршрутизация на уровне приёма — чтобы камера в европейской сети ни при каких обстоятельствах не отправляла кадры через инфраструктуру в США, независимо от того, где залогинен оператор. Дорабатывать это потом — проект на несколько месяцев; запустить в первой версии — несколько инженерных дней.

Сравнительная матрица: build, buy, гибрид или open source для масштабируемой VMS

Быстрая сетка решений по четырём типичным путям 2026 года. Выбирайте строку, которая соответствует размеру вашей команды, регуляторному полю и целевому сроку выхода — а не ту, которая звучит амбициознее.

ПодходПодходит дляУсилия на запускСрок выходаРиски
Готовый SaaSКоманды до 10 инженеров, типовой сценарийНизкие (1–2 недели)1–2 неделиVendor lock-in, ограничения по доработкам
Гибрид (SaaS + кастомный слой)Средний рынок, смешанные сценарииСредние (1–2 месяца)1–3 месяцаИнтеграционный долг, две системы на поддержке
Разработка на заказ (современный стек)Энтерпрайз, уникальные данные или требования соответствияВысокие (3–6 месяцев)6–12 месяцевСкорость инженерной команды, удержание людей
Open source на собственной инфраструктуреЧувствительные к стоимости, технически сильные командыВысокие (2–4 месяца)3–6 месяцевЭксплуатационная нагрузка, регулярные патчи безопасности

Часто задаваемые вопросы

Сколько одновременных потоков с камер тянет один медиасервер?

Зависит от кодека, разрешения и от того, декодирует ли сервер потоки или просто ретранслирует. Один узел Wowza / Flussonic / Janus / Pion на AWS c5.4xlarge обычно держит 200–500 одновременных потоков 1080p H.264 в режиме ретрансляции и проседает до 50–150 при декодировании под AI или транскодинг. Проверяйте свою цифру нагрузочным тестом до того, как закладываете её в план — бенчмарки вендоров оптимистичнее реальности.

Какая реальная стоимость хранения для VMS на 1 000 камер с архивом 90 дней?

При 2 Мбит/с на поток, 1 000 камер и 90 днях получаем ~2 ПБ. На AWS S3 Standard это около 3,3 млн ₽/мес. На схеме 7 дней горячий / 83 дня тёплый при 30 % битрейта на тёплом цифра падает до ~1 млн ₽/мес. Добавьте холодный архив на год, и совокупная стоимость на камеру в месяц опускается ниже 1 100 ₽ — достижимо и предсказуемо.

Когда переходить с монолита на микросервисы?

Конкретный триггер: когда время деплоя переваливает за 10 минут или когда один неудачный релиз уже больше одного раза блокировал живой мониторинг. Обычно это случается между 300 и 700 одновременных потоков. Не уходите в микросервисы раньше «потому что архитектурно так правильно» — эксплуатационные накладные расходы преждевременной декомпозиции хоронят небольшие команды.

Нужен ли нам Kubernetes для VMS?

До 1 000 одновременных потоков и при одном регионе — нет. Docker Compose плюс systemd плюс балансировщик нагрузки проще и дешевле. Выше 1 000 потоков или при нескольких регионах Kubernetes становится оправданным: примитивы автоскейлинга, выкаток и service discovery окупают свои эксплуатационные издержки. EKS/GKE/AKS лучше самосборного контрольного плана, если у вас нет сильной платформенной команды.

Как сделать мультитенантную изоляцию в общем облаке VMS?

Три слоя: (1) пер-тенантные ключи шифрования в KMS, чтобы данные в объектном хранилище были криптографически изолированы; (2) row-level security в БД метаданных или отдельные схемы под тенант; (3) RBAC, который применяется на API-гейтвее, а не только в UI. Аудит-логи должны помечать каждую попытку межтенантного доступа. Не полагайтесь на код приложения как на единственный механизм изоляции — одна ошибка превращается в межтенантную утечку.

Можно ли отказаться от облака и держать всю VMS on-prem?

Да, и для части регулируемых нагрузок (оборона, отдельные сегменты здравоохранения) это вообще единственный вариант. Пять решений выше остаются в силе — просто вместо S3 используется MinIO/Ceph, вместо EKS — on-prem Kubernetes, а вместо g5-инстансов — физические NVENC-GPU. Закладывайте 2–3× инженерных усилий на первоначальный запуск платформы и её эксплуатацию; логическая архитектура остаётся той же.

Функционал VMS

12 ключевых функций современной VMS в 2026 году

Какие возможности должна давать масштабируемая VMS — после того как под капотом выстроена правильная архитектура.

Мобильные SDK

Лучшие Android SDK для приложений видеонаблюдения в 2026 году

Какой мобильный SDK подключать к клиенту VMS — с той же оптикой стоимости, задержки и соответствия требованиям.

AI-аналитика

Тренды Android-видеонаблюдения 2026: 5 AI-функций

Как выглядит аналитический слой поверх архитектуры, описанной в этом гиде.

Источники

  • Документация AWS по классам хранения и производительности S3, 2026.
  • Матрица поддержки NVIDIA NVENC/NVDEC (архитектуры Ada, Blackwell).
  • Эталонные материалы Alliance for Open Media по развёртыванию кодека AV1.
  • CNCF Cloud Native Storage Landscape, выпуск 2026 года.
  • Внутренние метрики продакшен-развёртывания Фора Софт V.A.L.T.

Резюмируя — пять решений, а не пять функций

Дизайн масштабируемой VMS в 2026 году — это не про выбор лучшего производителя камер или самого большого региона облака. Это про то, чтобы рано принять пять архитектурных решений — приём, тиринг хранения, распределение edge/облако, транскодинг, автоскейлинг — и заложить наблюдаемость и соответствие требованиям в фундамент, а не прикручивать их потом.

Платформы, которые дорастают до 10 000+ камер, — это не те, у кого больше всего функций. Это те, где команда основателей в первый же день приняла эти пять решений правильно, а всё остальное сложилось вокруг.

Строите свою VMS?

Дайте нам нагрузочно проверить вашу архитектуру до того, как она уйдёт в продакшен.

Фора Софт запускала VMS-платформы — от пилотов на 100 камер до продакшен-развёртываний на 10 000+ камер. Свяжитесь с нами: либо подтвердим ваш план, либо подсветим два сценария, по которым он вероятнее всего сломается на масштабе.

Позвоните нам → Напишите нам →

  • Технологии