Схема стриминговой платформы: захват видео, кодирование и доставка для воспроизведения на разных устройствах

Главное

Сначала выберите режим, потом стек. VOD, live-стриминг и видеоконференции требуют принципиально разных протоколов, кодеков и бюджетов — смешивать их без плана значит сжигать деньги.

Задержка определяет 80% архитектуры. Меньше 500 мс — это WebRTC SFU. 2–5 с — LL-HLS. 10–30 с — стандартный HLS или DASH через CDN. Подбирайте протокол под допустимую задержку, а не под моду.

На исходящий трафик CDN обычно уходит 50–70% счёта. Cloudflare Stream, Bunny и Hetzner могут сократить egress в 5–10 раз по сравнению с CloudFront на больших объёмах — но только если cache-hit ratio держится выше 90%.

SaaS выигрывает до 50 ТБ/мес, self-hosting — выше. LiveKit Cloud, Mux и Cloudflare Stream дешевле, чем своя сборка, пока ваш egress или объём минут не пересечёт точку безубыточности.

Реальный MVP занимает 4–12 недель, а не 12 месяцев. Благодаря Agent Engineering Фора Софт обычно выпускает рабочий VOD- или live-MVP за недели, а не за кварталы — и вы проверяете product-market fit раньше, чем счёт за инфраструктуру вырастет в разы.

Почему Фора Софт написала этот гайд

Фора Софт занимается продуктами для видеосвязи, стриминга и видеоконференций в реальном времени с 2005 года. За плечами — 625+ выпущенных продуктов: HD-классы для BrainCert (500 млн+ минут видео по 10 дата-центрам, 100 тыс.+ клиентов, четырёхкратный лауреат Brandon Hall Award), SaaS для видеонаблюдения VALT (770+ организаций, 50 тыс.+ активных пользователей на full-HD-стримах RTMPS), платформа удалённого видеопроизводства Speed.Space с потоком 1080p при 8 Мбит/с (среди клиентов — Netflix, HBO и EA), и live-платформа для трейдинга TradeCaster (46 тыс.+ трейдеров вещают рабочий стол с чатом в реальном времени).

Мы написали этот гайд, потому что большинство стриминговых проектов спотыкается в одних и тех же трёх местах: команда выбирает неправильный протокол под свою задержку, недооценивает egress CDN на порядок или пишет собственный SFU там, где готовый open-source-стек дал бы релиз за недели. Мы собрали наш опыт в одну схему принятия решений, которую можно применить ещё до первой строчки кода.

Наша позиция прямая: мы — команда разработки на заказ, использующая Agent Engineering, чтобы выпускать быстрее обычных агентств. Это значит, что наши оценки чаще оказываются ниже диапазонов, которые вы видите в других гайдах 2026 года: мы сжимаем исследование, скелет проекта и тестовые циклы с помощью AI-кодинг-агентов, оставляя senior-инженеров в контуре.

Нужно второе мнение по архитектуре стриминга?

30 минут с senior-инженером, который выпускал VOD, live и видеоконференции в продакшен. Без слайдов — только разбор у доски.

Позвоните нам → Напишите нам →

Три режима видео: выберите один, прежде чем выбирать стек

Каждое приложение для видеостриминга относится к одному из трёх режимов: видео по запросу (Video on Demand, VOD), live-стриминг или видеоконференция. На уровне инфраструктуры у них почти ничего общего. Платформа VOD кэширует закодированные файлы на edge и отдаёт их по HTTP. Прямая трансляция принимает один источник и раздаёт его тысячам зрителей с задержкой 2–30 с. Конференц-продукт переносит несколько двунаправленных потоков через SFU или MCU с задержкой меньше 500 мс.

Команды, пытающиеся «уметь всё с первого дня», переплачивают по всем направлениям. Сначала запустите режим, который приносит основную выручку, и добавляйте остальные только тогда, когда интервью с клиентами покажут, что это нужно.

Видео по запросу (VOD)

Пользователи смотрят заранее записанный контент в своём ритме: Netflix, YouTube, образовательная платформа, библиотека фитнес-видео. Инженерная задача — хранение, лесенки транскодирования, упаковка (HLS/DASH) и кэширование CDN. Допустимая задержка фактически бесконечна: 30 секунд на старте — не проблема, лишь бы воспроизведение было плавным.

Live-стриминг

Один автор или камера, много зрителей, реальное или почти реальное время. Twitch, YouTube Live, спортивная трансляция, поток для iGaming, live-шопинг. Задача — надёжность ingest, кодирование в реальном времени, чанковая упаковка и раздача через CDN. Допустимая задержка зависит от продукта: 30 мс для iGaming, 3 с для вебинара, 30 с для концерта.

Видеоконференция

Много участников, двунаправленная связь, полностью интерактивный сценарий. Zoom, Teams, кабинет телемедицины, виртуальный класс. Задача — ёмкость SFU, simulcast, адаптация полосы пропускания и эхоподавление. Задержка должна оставаться ниже 500 мс, иначе разговор разваливается. Наши проекты ProVideoMeeting и BrainCert живут именно в этом режиме.

Берите VOD, когда: продукт о потреблении в удобное время — курсы по запросу, архивы событий, премиальные библиотеки, короткие видео — и вы готовы мириться с задержкой старта 10–30 с.

Берите live-стриминг, когда: один источник должен достичь многих зрителей в почти реальном времени — спорт, события, торговые потоки, live-шопинг — и допустима задержка от 1 до 30 с.

Берите видеоконференцию, когда: участники отвечают друг другу — телемедицина, виртуальный класс, собеседование, звонок в поддержку — и задержка свыше 500 мс разрушит разговор.

Лесенка задержек: подбираем протокол под сценарий

Задержка — самое важное число в стриминговом проекте. Она определяет протокол, протокол определяет инфраструктуру, инфраструктура определяет стоимость. Сначала выбирайте целевую задержку, потом WebRTC, HLS или DASH.

Сценарий Макс. задержка Протокол Потолок масштаба
iGaming, ставки на спорт < 500 мс WebRTC SFU ~5 000 зрителей на узел; больше — кластер
Видеоконференции, телемедицина < 500 мс WebRTC SFU / MCU 500–1 000 активных участников на узел
Live-аукционы, киберспорт-коучинг < 1 с WebRTC или SRT Тысячи при кластеризации
Вебинары, Q&A, live-шопинг 2–5 с LL-HLS / LL-DASH Миллионы через CDN
Спортивные трансляции, новости 5–10 с LL-HLS Миллионы через CDN
Концерты, кейноуты, развлечения 15–30 с Стандартный HLS / DASH Миллионы через CDN
Библиотека VOD Любая (старт 1–3 с) HLS / DASH + CDN Не ограничен, только хранилищем

Две частые ошибки: выбрать WebRTC для пассивной трансляции на 100 000 зрителей (потратите в 10 раз больше, чем на LL-HLS) и выбрать HLS для разговора двух человек (двадцатисекундная задержка делает live-чат бесполезным). Подробнее в нашем сравнении архитектур видеочата и общих принципов выбора протокола.

VOD-стек: кодеки, упаковка, хранение, CDN

Современный VOD-пайплайн состоит из пяти этапов: загрузка, транскодирование, упаковка, хранение, доставка. У каждого этапа своя кривая стоимости и качества. Цель — минимальный по размеру файл, который всё ещё попадает в воспринимаемое качество на каждом целевом устройстве.

Лесенка транскодирования

На один мастер-файл делайте 4–6 вариантов: 360p на 500 кбит/с, 480p на 1 Мбит/с, 720p на 2,5 Мбит/с, 1080p на 5 Мбит/с, 1440p на 8 Мбит/с, 2160p (4K) на 15 Мбит/с. H.264 для универсальной совместимости; H.265/HEVC сокращает байты на 40–50% при том же качестве. AV1 экономит ещё 30–50%, но кодирует в 5–10 раз медленнее — используйте его для длинного хвоста каталога, не для свежих загрузок.

Упаковка и адаптивный битрейт

HLS (экосистема Apple, всеобщая поддержка) и MPEG-DASH (гибкость, не-Apple-браузеры) — два формата, которые имеют значение. Унифицированная нарезка CMAF позволяет отдавать оба формата из одного набора файлов. Всегда генерируйте мастер-плейлист со списком всех вариантов, чтобы плеер мог адаптировать битрейт под состояние сети.

Хранение

S3-совместимое объектное хранилище — вариант по умолчанию. Hetzner Object Storage включает 20 ТБ исходящего трафика бесплатно на бакет и берёт примерно в десять раз меньше, чем AWS S3 на больших объёмах — компромиссы разбираем в нашем сравнении хостинг-провайдеров. У Cloudflare R2 вообще нет платы за egress, но это привязывает к экосистеме Cloudflare.

Доставка через CDN

CDN кэширует ваши чанки на edge, чтобы зритель в Сингапуре не тянул их с вашего origin во Франкфурте. Для VOD с контентом длинного хвоста реально достичь cache-hit ratio выше 92%. Bunny, Cloudflare и Fastly работают хорошо; AWS CloudFront — вариант по умолчанию, если вы и так глубоко в AWS. Математику серверов и egress мы разбираем в гайде по оценке стоимости сервера.

Берите управляемую VOD-платформу (Cloudflare Stream, Mux, api.video), когда: ваш каталог меньше 10 ТБ, вы стримите меньше 100 млн минут в месяц и не хотите выделять отдельного инженера под видеоэксплуатацию.

Стек live-стриминга: ingest, транскодирование, раздача

Live-пайплайн выглядит так: кодировщик (OBS, железный или браузерный) → сервер ingest (RTMP или SRT) → транскодер → упаковщик (LL-HLS или LL-DASH) → CDN → плеер. Каждый переход добавляет задержку. Каждый переход может отказать независимо.

Протоколы ingest

RTMP — двадцатилетний стандарт по наследству: его поддерживает каждый кодировщик, но он работает поверх TCP и проседает на нестабильных сетях. SRT (Secure Reliable Transport) — современная замена: UDP с FEC и шифрованием, рассчитанный на профессиональный ingest по публичному интернету. WebRTC ingest — передний край: сквозная задержка меньше секунды, но в железных кодировщиках поддержка пока не повсеместная.

Транскодирование в реальном времени

Live-транскодирование прогоняет поток через лесенку ABR в реальном времени. Аппаратные кодировщики (NVIDIA NVENC, Intel Quick Sync, AMD VCE) экономят CPU в 10 раз по сравнению с программными x264/x265 и сокращают задержку на сотни миллисекунд за проход. Если у вас больше 10 параллельных потоков, GPU-серверы окупаются за 3–6 месяцев.

Раздача через LL-HLS

Low-Latency HLS использует чанки 200–500 мс и частичную отдачу сегментов, чтобы попадать в сквозную задержку 2–5 с и при этом ехать по обычным HTTP-CDN. Это золотая середина для 80% коммерческого live-стриминга — масштабируется лучше WebRTC, задержка ниже, чем у стандартного HLS. Спецификация Apple LL-HLS и CMAF-CTE сейчас уже широко поддержаны.

Рестриминг и мультиплатформенность

Инструменты вроде Restream, Castr или самописных FFmpeg-пайплайнов позволяют из одного источника раздавать на YouTube, Twitch, Facebook, LinkedIn и собственный origin. Для авторов это утраивает охват. Для инженеров — означает, что слой ingest должен пережить самую слабую из downstream-платформ: следите за каждым выходом отдельно.

Строите live-стриминговый продукт?

Получите конкретную архитектуру: протокол ingest, слой транскодирования, CDN и оценку месячного бюджета под ваше количество зрителей.

Позвоните нам → Напишите нам →

Стек видеоконференций: SFU, MCU, P2P

Видеоконференция маршрутизирует двунаправленные медиапотоки между N участниками. Три классические топологии, у каждой — чёткий рабочий диапазон.

P2P-mesh

Каждый участник отправляет напрямую каждому другому участнику. Нулевая стоимость сервера, минимальная задержка, но трафик растёт как O(N²). Практический потолок — 4–6 участников на 720p. Дальше upload-канал упирается в потолок.

SFU (Selective Forwarding Unit)

Каждый участник отправляет один поток на SFU, а SFU раздаёт его остальным. Трафик клиента растёт как O(N). Правильно настроенный узел SFU тянет 500–1 000 активных потоков; mediasoup, Janus и LiveKit попадают в этот диапазон. Кластеризуйте по регионам, чтобы дойти до сотен тысяч. Это умолчание для современных конференций — Zoom, Teams, Meet внутри тоже работают на SFU-топологии.

MCU (Multipoint Control Unit)

Сервер декодирует каждый входящий поток, склеивает их в одно итоговое видео и заново кодирует. Полоса на клиенте остаётся одинаковой независимо от числа участников. Цена — огромная нагрузка на CPU сервера: 50-человековая MCU-встреча может загрузить мощную GPU-машину. MCU имеет смысл, когда вам нужна одна сведённая запись, совместимость с SIP-шлюзами или клиенты, которые не умеют SFU (старые legacy-эндпоинты). Наш разбор P2P vs MCU vs SFU подробно проходит по каждому компромиссу.

Simulcast и SVC

Любой SFU в 2026 году поддерживает simulcast: каждый отправитель публикует 2–3 потока с разными битрейтами, а SFU пересылает каждому получателю лучший доступный ему слой. SVC (масштабируемое кодирование видео) идёт дальше — один закодированный поток с несколькими временными и пространственными слоями — и уже зрел в VP9 и AV1. Оба резко улучшают адаптацию полосы в встречах со смешанными сетями.

Берите SFU, когда: вам нужно интерактивное видео с 4–500 одновременно активных участников и вы контролируете клиент — браузер, мобильное приложение или десктоп с поддержкой WebRTC.

Сравнение протоколов: WebRTC vs LL-HLS vs HLS vs DASH

Протокол определяет вашу задержку, инфраструктуру и счёт. Вот таблица, которую мы используем у себя, когда клиент говорит «давайте просто на WebRTC» или «давайте просто на HLS».

Протокол Задержка Масштаб через CDN Поддержка устройств Стоимость инфры
WebRTC (SFU) 150–500 мс Сложно; нужны SFU-кластеры Все современные браузеры + мобильные Высокая (нагрузка на CPU)
LL-HLS 2–5 с Через стандартный HTTP-CDN Apple нативно, остальное через hls.js Низкая (нагрузка на CDN)
Стандартный HLS 15–30 с Через стандартный HTTP-CDN Универсальная Минимальная
MPEG-DASH 6–30 с Через стандартный HTTP-CDN Не-Apple, через dash.js Минимальная
RTMP (ingest) 1–5 с на ingest Не для воспроизведения Все кодировщики Средняя
SRT (ingest) < 1 с на ingest Не для воспроизведения Растёт (профессиональные кодировщики) Средняя

Правило большого пальца: если один и тот же поток смотрит больше 5 000 пассивных зрителей, нужен HLS или LL-HLS через CDN. WebRTC SFU не раздаёт дёшево — каждый зритель занимает серверное соединение. Если нужны и интерактивность (небольшая группа спикеров), и масштаб (много зрителей), используйте WebRTC для спикеров и LL-HLS для остальных.

Выбор кодека: H.264 vs H.265 vs AV1 vs VP9

Выбор кодека — баланс трёх вещей: эффективность сжатия, поддержка устройств и стоимость кодирования. Неправильное умолчание стоит вам 30–50% на egress либо закрывает доступ старым устройствам.

Кодек Сжатие vs H.264 Скорость кодирования Поддержка устройств 2026 Лицензионные сборы
H.264 / AVC База Самая высокая Универсальная Зрелый патентный пул
H.265 / HEVC −40…−50% байт В 3–5 раз медленнее Широкая; слабее в старых браузерах Сложно (несколько пулов)
AV1 −55…−70% байт В 5–10 раз медленнее Растёт; только свежие чипсеты Без лицензионных сборов
VP9 −35…−45% байт В 5 раз медленнее Chrome/Android; на Apple нет live Без лицензионных сборов
VP8 −20% байт В 2 раза медленнее Уходит; только как WebRTC-фолбэк Без лицензионных сборов

Наши умолчания на 2026: H.264 — универсальный запасной вариант, H.265 — основной для современных устройств и live-трансляций, AV1 — только для длинного хвоста VOD, где экономия на хранении и egress за 3+ года явно перекрывает расходы на кодирование. Для WebRTC-конференций VP8 или H.264 остаются самым безопасным выбором для совместимости; VP9 и AV1 набирают вес, но клиентская поддержка всё ещё фрагментирована.

Управляемый SaaS vs кастомная сборка: экономика

Самая низкая ставка за минуту в 2026 году почти всегда у управляемой платформы. А самая низкая совокупная стоимость за 3 года — часто нет. Вот рабочая линия, по которой мы помогаем клиентам выбирать.

Подход Типичная стоимость Срок выпуска Кому подходит
Agora SDK Тарифы по аудио/видео-юнитам Дни Быстрые MVP, голосовые приложения
Twilio Video ~0,3 ₽ за минуту участника Дни Команды, уже сидящие на Twilio SMS/voice
LiveKit Cloud ~3–3,7 коп. за минуту WebRTC 1–2 недели WebRTC-first SaaS, в 10 раз дешевле Twilio
Mux (live + VOD) ~5 ₽/мин кодирование + ~1,8 ₽/мин доставка Дни Управляемый full-stack, средние и небольшие каталоги
Cloudflare Stream ~375 ₽ за 1 000 мин хранения + 75 ₽ за 1 000 мин доставки Дни Самый экономный для небольшого VOD и коротких live
Self-hosted LiveKit + Hetzner Только инфраструктура; никаких поминутных тарифов 2–6 недель настройки > 50 ТБ/мес egress, зрелая DevOps-команда
Кастомный mediasoup/Janus Разработка + инфраструктура; никаких поминутных тарифов 2–4 месяца Дифференциация продукта в медиапути

Логика точки безубыточности проста. Если вы сжигаете 1,5 млн ₽ в месяц на Twilio, self-hosted-кластер LiveKit на Hetzner может стоить на 70% меньше — но потребуется DevOps-инженер с зарплатой 9 млн ₽ в год. Выше ~600 тыс. ₽/мес на SaaS self-hosting окупается примерно за 18 месяцев. Ниже — продолжайте выпускать функции и не отвлекайтесь. Наш разбор альтернатив Agora и плейбук по LiveKit подробно показывают форму миграции.

Ловушка CDN и egress

Каждая стриминговая команда недооценивает egress. Закладывают 300–600 тыс. ₽/мес на хостинг и забывают, что один миллион зрительских минут 1080p при 5 Мбит/с — это около 37,5 ТБ исходящего трафика. По прайс-листу CloudFront это ~240 тыс. ₽. Помножьте на серьёзную аудиторию — и за месяц набегают семизначные суммы ещё до того, как бюджет утвердили.

Шпаргалка по ценам на egress (первые 10 ТБ/мес)

Bunny CDN: ~0,75–1,1 ₽/ГБ в Северной Америке и Европе. Cloudflare: фиксированно 375–1 500 ₽/ТБ через Stream или R2. AWS CloudFront: ~6,3 ₽/ГБ в Северной Америке, дороже в Европе и APAC. Hetzner: 20 ТБ включены в каждый бакет Object Storage, перерасход — ~0,07 ₽/ГБ.

Cache-hit ratio — ваш главный рычаг

95% cache-hit ratio означает, что CDN отдаёт 95 из 100 запросов, не касаясь вашего origin. 60% — что вы платите дважды: за egress origin и за egress CDN. Подбирайте TTL под тип контента (VOD: 24 часа и больше, live: длительность чанка плюс 1 с), используйте подписанные URL с общими ключами кэша и предзагружайте длинный хвост со своих топ-10 страниц.

Адаптивный битрейт как инструмент экономии

ABR — не только про качество для зрителя, но и про ваш кошелёк. Отдавать 720p тому, кто сидит на 3G, вместо принудительных 1080p — это минус 50% egress на этого пользователя. На миллионе минут в месяц это уже серьёзные деньги. Лесенка ABR должна быть даже в MVP.

DRM, шифрование и комплаенс

Безопасность в стриминге — это четыре слоя: транспортное шифрование, доступ по токенам, шифрование контента и DRM (управление цифровыми правами). Пропустите не тот слой — и либо утечёт контент, либо вы потратите бюджет на защиту, которая вам не нужна.

Транспорт и доступ

HTTPS везде, RTMPS для live-ingest, SRT с шифрованием для профессиональной подачи. Подписанные URL (CloudFront, S3 presigned, Cloudflare signed) держат анонимных зрителей подальше от origin. JWT-токены несут идентификацию зрителя и его права и должны жить минутами, а не часами.

Шифрование контента

AES-128 для HLS, CENC для DASH. Одно шифрование останавливает случайный парсинг, но не упорного пользователя с отладчиком. Для этого нужен DRM.

Управление цифровыми правами

Widevine (Google, бесплатная лицензия) покрывает Android, Chrome, Edge. FairPlay (Apple, бесплатно при developer-аккаунте) покрывает iOS, Safari, tvOS. PlayReady (Microsoft, платный) покрывает Windows и Xbox. Полноценное мульти-DRM-развёртывание обычно ставят на управляемый сервис вроде EZDRM (~15 тыс. ₽/мес), BuyDRM (от ~7 400 ₽/мес) или Drmtoday, которые держат сервера лицензий за вас — гораздо дешевле, чем хостить ключевую инфраструктуру самим. DRM можно пропустить для UGC-контента, инди-каталогов и внутренних платформ. Подключайте его, только когда этого требуют студии или правообладатели либо когда уличная стоимость контента явно оправдывает расходы.

Комплаенс — GDPR, HIPAA, SOC 2

Если продукт касается европейских зрителей, нужны карта данных по GDPR, политика хранения и сценарий экспорта данных. Телемедицина в США означает соглашения BAA уровня HIPAA с каждым провайдером инфраструктуры, сквозное шифрование и подписанные журналы доступа. SOC 2 — обязательный минимум для корпоративных SaaS-покупателей. Полный чек-лист — в нашем гайде по функциям безопасности стриминговых приложений.

Пороги масштаба: когда менять архитектуру

Архитектуры не масштабируются линейно. Есть резкие обрывы, на которых правильный выбор становится неправильным.

1. 6 участников → меняем P2P на SFU. Дальше шести mesh упирается в пользовательский интернет. Добавляйте SFU — LiveKit, mediasoup или Janus.

2. 500 одновременных потоков на SFU → кластеризуемся. Один узел SFU выдыхается на 500–1 000 активных потоков. Дальше — региональные SFU-кластеры с каскадированием и балансировщик сигнальных запросов.

3. 5 000 пассивных зрителей → переходим на LL-HLS. Раздача через WebRTC — затратное по CPU удовольствие. Гибридные архитектуры пускают спикеров через WebRTC и параллельно отдают LL-HLS-копию длинному хвосту зрителей через CDN.

4. 50 ТБ/мес egress → пересогласовываем CDN. На CloudFront включаются объёмные скидки; Bunny, Cloudflare и Hetzner становятся ощутимо дешевле. Подключение второго CDN окупает дополнительную инженерию.

5. 100 тыс. одновременных зрителей → multi-region origin. Один origin во Франкфурте, раздающий live-стрим на 100 тыс. зрителей по миру, ляжет под нагрузкой TLS-хендшейков. Реплицируйте origin, используйте Anycast DNS и держите наготове runbook на отказ.

Жжёте бюджет на CloudFront или Twilio?

Мы регулярно аудируем стриминговые счета — у большинства клиентов после смены протокола или CDN экономия 30–70%. Запишитесь на ревью.

Позвоните нам → Напишите нам →

Мини-кейсы: чему нас научили реальные платформы

BrainCert пришёл в Фора Софт с LMS для виртуальных классов, которой нужно было масштабировать HD-видео и аудио на школы и центры тестирования по миру. Мы построили WebRTC-конференц-стек на 40-ядерных медиасерверах, распределённых по 10 дата-центрам. Сегодня платформа раздаёт 500 млн+ минут live-видео, обслуживает 100 тыс.+ клиентов и собрала четыре награды Brandon Hall Award.

VALT — SaaS для видеонаблюдения, который мы сделали для 770+ организаций в США. Он раздаёт full-HD-потоки с IP-камер Axis по RTMPS, поддерживает мгновенное воспроизведение, ролевый доступ, мониторинг нескольких камер в live и экспорт доказательной базы. Сегодня 50 тыс.+ активных пользователей опираются на него каждый день в задачах правоохранения, медицины и защиты детей.

Speed.Space — платформа удалённого видеопроизводства, которую Фора Софт построила для распределённых съёмочных групп. Захват идёт в 1080p при 8 Мбит/с — примерно впятеро качественнее обычной конференции — до 25 участников и без простоев. Среди клиентов — Netflix, HBO, EA и продакшены, показанные на Парижской неделе моды. Хотите аналогичную оценку для своего стека? Свяжитесь с нами — разберём миграцию за 30 минут.

Модель стоимости: как выглядит реальная оценка

Вот как мы скоупим стриминговые проекты в Фора Софт. Это реальные диапазоны, которые мы выдерживаем в коммерческих предложениях, сжатые за счёт Agent Engineering — большинство агентств называют в 1,5–2 раза больше за тот же объём.

Объём Срок Что выпускается
VOD MVP 4–6 недель Веб + iOS/Android-плеер, HLS + ABR, Mux или Cloudflare Stream, базовый поиск и аутентификация
Live-стриминг MVP 8–12 недель RTMP/SRT ingest, LL-HLS-проигрывание, CDN, чат, запись в VOD
Конференц-MVP 6–10 недель SFU на LiveKit или mediasoup, комнаты, simulcast, запись, скриншаринг
Премиальная стриминговая платформа 4–6 месяцев VOD + live + подписка + DRM + аналитика + SSO + админ-бэкофис
Корпоративный мультитенант 6–12 месяцев Multi-region, мультиязычность, white-label, SSO, HIPAA/SOC 2, AI-функции

Инфраструктура обычно добавляет от 37 тыс. до 375 тыс. ₽/мес для небольшого продукта и 375 тыс.–3,7 млн ₽/мес после нескольких тысяч одновременных потоков. Разбивка по модулям — в нашей статье о стоимости разработки видеостримингового приложения, а математику по типичным конфигурациям мы даём в гайде по оценке стоимости сервера.

Схема принятия решения: выберите стек за пять вопросов

До того как покупать SDK или фиксировать CDN, ответьте на эти пять вопросов письменно. Ответы каскадно ложатся в архитектуру.

В1. Какая максимально допустимая задержка? Меньше 500 мс — вы вынуждены брать WebRTC. 2–5 с — допускает LL-HLS. 10–30 с — самый широкий и дешёвый вариант через HLS/DASH.

В2. Сколько одновременных зрителей на пике? До 5 000 одновременно можно оставаться на WebRTC. Выше 5 000 — обязательно подключайте CDN и HTTP-нарезку.

В3. Зритель платит, и за что? Бесплатный тариф с рекламой терпит более низкое качество; платные подписчики ждут минимум 1080p и мгновенный старт. Корпоративные покупатели ждут SSO, DRM и журналы аудита.

В4. Сколько вы готовы платить за egress в месяц? Прикидка на салфетке: 1 млн минут 1080p ≈ 37,5 ТБ. Умножьте на цену за ГБ — получите нижнюю границу.

В5. Есть ли в штате DevOps-инженер? Нет → оставайтесь на управляемых сервисах (Mux, Cloudflare Stream, LiveKit Cloud). Да → self-hosting становится осмысленным, когда счёт за SaaS переваливает ~600 тыс. ₽/мес.

Пять ловушек, которые топят стриминговые проекты

1. Выбор WebRTC для пассивной массовой раздачи. WebRTC прекрасен для интерактивного сценария с задержкой меньше секунды, но стоимость сервера на одного зрителя ломает экономику на масштабе. Если 10 тыс. зрителей смотрят одного автора, правильный ответ — LL-HLS, даже если задержка будет на 3 с больше.

2. Один битрейт на весь поток. Один вариант 1080p на 5 Мбит/с означает, что любой с мобильным или слабым Wi-Fi будет ребуферить. Всегда отдавайте лесенку ABR — минимум 4 варианта — либо смиритесь с потерей 25% зрителей из-за ребуферинга.

3. Игнорирование cache-hit ratio. 60% cache-hit ratio на вашем CDN означает, что вы платите дважды — за egress origin и за egress CDN. Лекарство — длинные TTL, подписанные URL с общими ключами и origin shield. Мы видели, как команды экономили 50% счёта за CDN за два дня конфигурационной работы.

4. Пишут собственный SFU с нуля. mediasoup, LiveKit, Janus и Jitsi — зрелые, обкатанные в бою, open-source. Свой SFU с нуля — это 6–12 месяцев элитной инженерии до первого продакшен-звонка. Делайте форк или стройте поверх; не изобретайте заново.

5. Нет мониторинга QoS. Невозможно оптимизировать то, чего не видно. С первого дня инструментируйте битрейт доставки, успешность подключения, частоту фризов, TTFF (time to first frame) и долю ребуферинга. Prometheus + Grafana для серверных метрик, QoS-маячок из плеера для клиентских. Без них вы отлаживаете вслепую.

KPI: что измерять

KPI качества. Цель: time-to-first-frame (TTFF) ниже 2 с, доля ребуферинга меньше 0,5%, средний битрейт выше 70% от верхнего варианта по сессии. Для конференций — джиттер меньше 30 мс и RTT меньше 150 мс в пределах региона.

Бизнес-KPI. Время просмотра на активного пользователя, доля досмотра, конверсия из триала в платный тариф и churn на 30/60/90 дней. Для live — пиковое число одновременных зрителей, среднее время просмотра, количество шерингов в соцсети. Если монетизируетесь подпиской — отслеживайте LTV/CAC и стоимость одного просмотренного часа: именно последнее число волнует вашего CFO.

KPI надёжности. Доля успешных подключений выше 99%, аптайм выше 99,9%, mean time to detect (MTTD) для отказов ingest — меньше 5 минут, cache-hit ratio выше 92% для VOD и 85% для live. Пороги алертов задавайте ниже целевых значений, а не на них.

Когда НЕ нужно строить своё стриминговое приложение

Не каждая стриминговая идея требует своего ПО. Если всё, что вы делаете, — это раздача на Facebook, Instagram и YouTube, используйте их встроенный стек. Если у вас внутренние вебинары на 500 человек пару раз в квартал, Zoom или Google Meet дешевле всего, что вы можете построить.

Стройте кастомно, когда выполняется одно из четырёх условий: (1) ваш продукт встраивает видео в дифференцированный воркфлоу (телемедицина, live-шопинг, отраслевой инструмент совместной работы); (2) комплаенс или брендинг требуют полного контроля над медиапутём; (3) ваша юнит-экономика работает только на масштабе, который не даёт ни один SaaS; (4) сам видеоопыт и есть продукт, а не его обёртка. Если ни одно условие не выполняется, готовый SaaS плюс ваша прикладная логика — почти всегда правильный выбор.

FAQ

Сколько времени занимает создание MVP видеостримингового приложения?

Сфокусированный VOD-MVP выпускается за 4–6 недель. Live-стриминговому MVP нужно 8–12 недель: вы добавляете ingest, транскодирование в реальном времени и раздачу. Конференц-MVP с SFU на WebRTC укладывается в 6–10 недель. Благодаря Agent Engineering Фора Софт обычно выходит к нижней границе этих диапазонов.

WebRTC — всегда ли правильный выбор для стриминга с низкой задержкой?

Только для двунаправленных или интерактивных сценариев с задержкой меньше секунды. Для раздачи «один ко многим», где достаточно задержки до 5 с, LL-HLS дешевле, масштабируется через любой HTTP-CDN и работает на большем числе устройств. Полезная эвристика: WebRTC — для разговоров, LL-HLS — для трансляций.

Что использовать в 2026: H.264, H.265 или AV1?

H.264 как универсальный запасной вариант. H.265 (HEVC) как основной для современных устройств — он сокращает байты на 40–50%. AV1 только для длинного хвоста VOD-каталогов, где экономия на egress за 3+ года оправдывает кодирование, которое в 5–10 раз медленнее. Для конференций VP8 или H.264 остаются самым безопасным WebRTC-выбором.

Сколько реально стоит видеостриминговое приложение?

Разработка масштабируется со скоупом: VOD-MVP укладывается в нижнюю границу семизначных бюджетов в рублях, премиальная мультимодульная платформа — в середине восьмизначных. Месячная инфраструктура — от нескольких десятков тысяч рублей для ранних продуктов до миллионов для приложений на масштабе. Подробный разбор — в нашей статье о стоимости разработки видеостриминговых приложений.

Нужен ли DRM моей стриминговой платформе?

Только если вы распространяете контент с лицензией от студий, этого требуют ваши контракты, или уличная стоимость контента явно оправдывает ~7–37 тыс. ₽/мес за управляемый DRM-сервис. Для большинства инди-авторов, UGC и внутреннего корпоративного видео подписанных URL плюс AES-шифрования хватает по защите за долю той же цены.

Можно ли мигрировать с Agora или Twilio, чтобы сэкономить?

Да — как только счёт переваливает примерно 375–600 тыс. ₽/мес, миграция на LiveKit Cloud или self-hosted LiveKit/mediasoup обычно экономит 60–90% поминутной стоимости. Шаблон миграции и компромиссы мы разбираем в нашем гайде по альтернативам Agora.

Какой CDN выбрать для стримингового приложения?

Для большинства новых продуктов до 10 ТБ/мес Cloudflare Stream или Bunny CDN дают лучшее соотношение цена/производительность. Выше 50 ТБ/мес связка из нескольких CDN — CloudFront + Bunny (или Hetzner в качестве origin за Bunny) — резко режет egress. Всегда отслеживайте cache-hit ratio: соотношение 90%+ важнее, чем выбор конкретного провайдера.

Какой максимальный размер встречи на SFU?

Один правильно настроенный узел SFU тянет 500–1 000 активных потоков — примерно 50 участников, каждый из которых публикует два слоя simulcast и подписан на 10 видимых плиток. Для более крупных событий собирайте SFU в кластеры по регионам с каскадированием. Математика масштабирования — в нашем разборе P2P vs MCU vs SFU.

Стоимость

Разбор стоимости видеостримингового приложения

Помодульная разбивка цены для VOD-, live- и конференц-сборок.

Архитектура

P2P vs MCU vs SFU

Где побеждает каждая топология и почему гибрид обычно прав.

Протокол

WebRTC vs HLS для стриминга

Задержка, масштаб и компромиссы по стоимости простым языком.

Масштаб

Масштабирование стримингового приложения

Как провести стриминговый продукт от тысячи до миллиона зрителей.

Миграция

Альтернативы Agora.io в 2026

LiveKit, mediasoup, Jitsi и Janus с разбором по экономике.

Готовы выпустить своё видеостриминговое приложение?

Что отличает выигравшие стриминговые продукты от заглохших — не самый модный кодек и не самый передний протокол. Это честный ответ на пять вопросов: какая нужна задержка, сколько зрителей на пике, что вы можете позволить себе на egress, кто платит за контент и кто эксплуатирует инфраструктуру. Как только эти ответы зафиксированы, стек складывается сам.

Фора Софт с 2005 года выпустила 625+ продуктов в этой нише: телемедицина, виртуальные классы, удалённое видеопроизводство, трейдерский стриминг, SaaS для видеонаблюдения. Если вы стартуете стриминговый проект или хотите второе мнение по тому, что уже в работе, — обычно 30-минутного звонка достаточно, чтобы сэкономить недели неверных решений.

Стартуете или перестраиваете стриминговый продукт?

Расскажите нам сценарий — набросаем архитектуру, модель стоимости и сроки за 30 минут. Без питч-дека, только доска.

Позвоните нам → Напишите нам →

  • Технологии