
Главное
• Сначала выберите режим, потом стек. VOD, live-стриминг и видеоконференции требуют принципиально разных протоколов, кодеков и бюджетов — смешивать их без плана значит сжигать деньги.
• Задержка определяет 80% архитектуры. Меньше 500 мс — это WebRTC SFU. 2–5 с — LL-HLS. 10–30 с — стандартный HLS или DASH через CDN. Подбирайте протокол под допустимую задержку, а не под моду.
• На исходящий трафик CDN обычно уходит 50–70% счёта. Cloudflare Stream, Bunny и Hetzner могут сократить egress в 5–10 раз по сравнению с CloudFront на больших объёмах — но только если cache-hit ratio держится выше 90%.
• SaaS выигрывает до 50 ТБ/мес, self-hosting — выше. LiveKit Cloud, Mux и Cloudflare Stream дешевле, чем своя сборка, пока ваш egress или объём минут не пересечёт точку безубыточности.
• Реальный MVP занимает 4–12 недель, а не 12 месяцев. Благодаря Agent Engineering Фора Софт обычно выпускает рабочий VOD- или live-MVP за недели, а не за кварталы — и вы проверяете product-market fit раньше, чем счёт за инфраструктуру вырастет в разы.
Почему Фора Софт написала этот гайд
Фора Софт занимается продуктами для видеосвязи, стриминга и видеоконференций в реальном времени с 2005 года. За плечами — 625+ выпущенных продуктов: HD-классы для BrainCert (500 млн+ минут видео по 10 дата-центрам, 100 тыс.+ клиентов, четырёхкратный лауреат Brandon Hall Award), SaaS для видеонаблюдения VALT (770+ организаций, 50 тыс.+ активных пользователей на full-HD-стримах RTMPS), платформа удалённого видеопроизводства Speed.Space с потоком 1080p при 8 Мбит/с (среди клиентов — Netflix, HBO и EA), и live-платформа для трейдинга TradeCaster (46 тыс.+ трейдеров вещают рабочий стол с чатом в реальном времени).
Мы написали этот гайд, потому что большинство стриминговых проектов спотыкается в одних и тех же трёх местах: команда выбирает неправильный протокол под свою задержку, недооценивает egress CDN на порядок или пишет собственный SFU там, где готовый open-source-стек дал бы релиз за недели. Мы собрали наш опыт в одну схему принятия решений, которую можно применить ещё до первой строчки кода.
Наша позиция прямая: мы — команда разработки на заказ, использующая Agent Engineering, чтобы выпускать быстрее обычных агентств. Это значит, что наши оценки чаще оказываются ниже диапазонов, которые вы видите в других гайдах 2026 года: мы сжимаем исследование, скелет проекта и тестовые циклы с помощью AI-кодинг-агентов, оставляя senior-инженеров в контуре.
Нужно второе мнение по архитектуре стриминга?
30 минут с senior-инженером, который выпускал VOD, live и видеоконференции в продакшен. Без слайдов — только разбор у доски.
Три режима видео: выберите один, прежде чем выбирать стек
Каждое приложение для видеостриминга относится к одному из трёх режимов: видео по запросу (Video on Demand, VOD), live-стриминг или видеоконференция. На уровне инфраструктуры у них почти ничего общего. Платформа VOD кэширует закодированные файлы на edge и отдаёт их по HTTP. Прямая трансляция принимает один источник и раздаёт его тысячам зрителей с задержкой 2–30 с. Конференц-продукт переносит несколько двунаправленных потоков через SFU или MCU с задержкой меньше 500 мс.
Команды, пытающиеся «уметь всё с первого дня», переплачивают по всем направлениям. Сначала запустите режим, который приносит основную выручку, и добавляйте остальные только тогда, когда интервью с клиентами покажут, что это нужно.
Видео по запросу (VOD)
Пользователи смотрят заранее записанный контент в своём ритме: Netflix, YouTube, образовательная платформа, библиотека фитнес-видео. Инженерная задача — хранение, лесенки транскодирования, упаковка (HLS/DASH) и кэширование CDN. Допустимая задержка фактически бесконечна: 30 секунд на старте — не проблема, лишь бы воспроизведение было плавным.
Live-стриминг
Один автор или камера, много зрителей, реальное или почти реальное время. Twitch, YouTube Live, спортивная трансляция, поток для iGaming, live-шопинг. Задача — надёжность ingest, кодирование в реальном времени, чанковая упаковка и раздача через CDN. Допустимая задержка зависит от продукта: 30 мс для iGaming, 3 с для вебинара, 30 с для концерта.
Видеоконференция
Много участников, двунаправленная связь, полностью интерактивный сценарий. Zoom, Teams, кабинет телемедицины, виртуальный класс. Задача — ёмкость SFU, simulcast, адаптация полосы пропускания и эхоподавление. Задержка должна оставаться ниже 500 мс, иначе разговор разваливается. Наши проекты ProVideoMeeting и BrainCert живут именно в этом режиме.
Берите VOD, когда: продукт о потреблении в удобное время — курсы по запросу, архивы событий, премиальные библиотеки, короткие видео — и вы готовы мириться с задержкой старта 10–30 с.
Берите live-стриминг, когда: один источник должен достичь многих зрителей в почти реальном времени — спорт, события, торговые потоки, live-шопинг — и допустима задержка от 1 до 30 с.
Берите видеоконференцию, когда: участники отвечают друг другу — телемедицина, виртуальный класс, собеседование, звонок в поддержку — и задержка свыше 500 мс разрушит разговор.
Лесенка задержек: подбираем протокол под сценарий
Задержка — самое важное число в стриминговом проекте. Она определяет протокол, протокол определяет инфраструктуру, инфраструктура определяет стоимость. Сначала выбирайте целевую задержку, потом WebRTC, HLS или DASH.
| Сценарий | Макс. задержка | Протокол | Потолок масштаба |
|---|---|---|---|
| iGaming, ставки на спорт | < 500 мс | WebRTC SFU | ~5 000 зрителей на узел; больше — кластер |
| Видеоконференции, телемедицина | < 500 мс | WebRTC SFU / MCU | 500–1 000 активных участников на узел |
| Live-аукционы, киберспорт-коучинг | < 1 с | WebRTC или SRT | Тысячи при кластеризации |
| Вебинары, Q&A, live-шопинг | 2–5 с | LL-HLS / LL-DASH | Миллионы через CDN |
| Спортивные трансляции, новости | 5–10 с | LL-HLS | Миллионы через CDN |
| Концерты, кейноуты, развлечения | 15–30 с | Стандартный HLS / DASH | Миллионы через CDN |
| Библиотека VOD | Любая (старт 1–3 с) | HLS / DASH + CDN | Не ограничен, только хранилищем |
Две частые ошибки: выбрать WebRTC для пассивной трансляции на 100 000 зрителей (потратите в 10 раз больше, чем на LL-HLS) и выбрать HLS для разговора двух человек (двадцатисекундная задержка делает live-чат бесполезным). Подробнее в нашем сравнении архитектур видеочата и общих принципов выбора протокола.
VOD-стек: кодеки, упаковка, хранение, CDN
Современный VOD-пайплайн состоит из пяти этапов: загрузка, транскодирование, упаковка, хранение, доставка. У каждого этапа своя кривая стоимости и качества. Цель — минимальный по размеру файл, который всё ещё попадает в воспринимаемое качество на каждом целевом устройстве.
Лесенка транскодирования
На один мастер-файл делайте 4–6 вариантов: 360p на 500 кбит/с, 480p на 1 Мбит/с, 720p на 2,5 Мбит/с, 1080p на 5 Мбит/с, 1440p на 8 Мбит/с, 2160p (4K) на 15 Мбит/с. H.264 для универсальной совместимости; H.265/HEVC сокращает байты на 40–50% при том же качестве. AV1 экономит ещё 30–50%, но кодирует в 5–10 раз медленнее — используйте его для длинного хвоста каталога, не для свежих загрузок.
Упаковка и адаптивный битрейт
HLS (экосистема Apple, всеобщая поддержка) и MPEG-DASH (гибкость, не-Apple-браузеры) — два формата, которые имеют значение. Унифицированная нарезка CMAF позволяет отдавать оба формата из одного набора файлов. Всегда генерируйте мастер-плейлист со списком всех вариантов, чтобы плеер мог адаптировать битрейт под состояние сети.
Хранение
S3-совместимое объектное хранилище — вариант по умолчанию. Hetzner Object Storage включает 20 ТБ исходящего трафика бесплатно на бакет и берёт примерно в десять раз меньше, чем AWS S3 на больших объёмах — компромиссы разбираем в нашем сравнении хостинг-провайдеров. У Cloudflare R2 вообще нет платы за egress, но это привязывает к экосистеме Cloudflare.
Доставка через CDN
CDN кэширует ваши чанки на edge, чтобы зритель в Сингапуре не тянул их с вашего origin во Франкфурте. Для VOD с контентом длинного хвоста реально достичь cache-hit ratio выше 92%. Bunny, Cloudflare и Fastly работают хорошо; AWS CloudFront — вариант по умолчанию, если вы и так глубоко в AWS. Математику серверов и egress мы разбираем в гайде по оценке стоимости сервера.
Берите управляемую VOD-платформу (Cloudflare Stream, Mux, api.video), когда: ваш каталог меньше 10 ТБ, вы стримите меньше 100 млн минут в месяц и не хотите выделять отдельного инженера под видеоэксплуатацию.
Стек live-стриминга: ingest, транскодирование, раздача
Live-пайплайн выглядит так: кодировщик (OBS, железный или браузерный) → сервер ingest (RTMP или SRT) → транскодер → упаковщик (LL-HLS или LL-DASH) → CDN → плеер. Каждый переход добавляет задержку. Каждый переход может отказать независимо.
Протоколы ingest
RTMP — двадцатилетний стандарт по наследству: его поддерживает каждый кодировщик, но он работает поверх TCP и проседает на нестабильных сетях. SRT (Secure Reliable Transport) — современная замена: UDP с FEC и шифрованием, рассчитанный на профессиональный ingest по публичному интернету. WebRTC ingest — передний край: сквозная задержка меньше секунды, но в железных кодировщиках поддержка пока не повсеместная.
Транскодирование в реальном времени
Live-транскодирование прогоняет поток через лесенку ABR в реальном времени. Аппаратные кодировщики (NVIDIA NVENC, Intel Quick Sync, AMD VCE) экономят CPU в 10 раз по сравнению с программными x264/x265 и сокращают задержку на сотни миллисекунд за проход. Если у вас больше 10 параллельных потоков, GPU-серверы окупаются за 3–6 месяцев.
Раздача через LL-HLS
Low-Latency HLS использует чанки 200–500 мс и частичную отдачу сегментов, чтобы попадать в сквозную задержку 2–5 с и при этом ехать по обычным HTTP-CDN. Это золотая середина для 80% коммерческого live-стриминга — масштабируется лучше WebRTC, задержка ниже, чем у стандартного HLS. Спецификация Apple LL-HLS и CMAF-CTE сейчас уже широко поддержаны.
Рестриминг и мультиплатформенность
Инструменты вроде Restream, Castr или самописных FFmpeg-пайплайнов позволяют из одного источника раздавать на YouTube, Twitch, Facebook, LinkedIn и собственный origin. Для авторов это утраивает охват. Для инженеров — означает, что слой ingest должен пережить самую слабую из downstream-платформ: следите за каждым выходом отдельно.
Строите live-стриминговый продукт?
Получите конкретную архитектуру: протокол ingest, слой транскодирования, CDN и оценку месячного бюджета под ваше количество зрителей.
Стек видеоконференций: SFU, MCU, P2P
Видеоконференция маршрутизирует двунаправленные медиапотоки между N участниками. Три классические топологии, у каждой — чёткий рабочий диапазон.
P2P-mesh
Каждый участник отправляет напрямую каждому другому участнику. Нулевая стоимость сервера, минимальная задержка, но трафик растёт как O(N²). Практический потолок — 4–6 участников на 720p. Дальше upload-канал упирается в потолок.
SFU (Selective Forwarding Unit)
Каждый участник отправляет один поток на SFU, а SFU раздаёт его остальным. Трафик клиента растёт как O(N). Правильно настроенный узел SFU тянет 500–1 000 активных потоков; mediasoup, Janus и LiveKit попадают в этот диапазон. Кластеризуйте по регионам, чтобы дойти до сотен тысяч. Это умолчание для современных конференций — Zoom, Teams, Meet внутри тоже работают на SFU-топологии.
MCU (Multipoint Control Unit)
Сервер декодирует каждый входящий поток, склеивает их в одно итоговое видео и заново кодирует. Полоса на клиенте остаётся одинаковой независимо от числа участников. Цена — огромная нагрузка на CPU сервера: 50-человековая MCU-встреча может загрузить мощную GPU-машину. MCU имеет смысл, когда вам нужна одна сведённая запись, совместимость с SIP-шлюзами или клиенты, которые не умеют SFU (старые legacy-эндпоинты). Наш разбор P2P vs MCU vs SFU подробно проходит по каждому компромиссу.
Simulcast и SVC
Любой SFU в 2026 году поддерживает simulcast: каждый отправитель публикует 2–3 потока с разными битрейтами, а SFU пересылает каждому получателю лучший доступный ему слой. SVC (масштабируемое кодирование видео) идёт дальше — один закодированный поток с несколькими временными и пространственными слоями — и уже зрел в VP9 и AV1. Оба резко улучшают адаптацию полосы в встречах со смешанными сетями.
Берите SFU, когда: вам нужно интерактивное видео с 4–500 одновременно активных участников и вы контролируете клиент — браузер, мобильное приложение или десктоп с поддержкой WebRTC.
Сравнение протоколов: WebRTC vs LL-HLS vs HLS vs DASH
Протокол определяет вашу задержку, инфраструктуру и счёт. Вот таблица, которую мы используем у себя, когда клиент говорит «давайте просто на WebRTC» или «давайте просто на HLS».
| Протокол | Задержка | Масштаб через CDN | Поддержка устройств | Стоимость инфры |
|---|---|---|---|---|
| WebRTC (SFU) | 150–500 мс | Сложно; нужны SFU-кластеры | Все современные браузеры + мобильные | Высокая (нагрузка на CPU) |
| LL-HLS | 2–5 с | Через стандартный HTTP-CDN | Apple нативно, остальное через hls.js | Низкая (нагрузка на CDN) |
| Стандартный HLS | 15–30 с | Через стандартный HTTP-CDN | Универсальная | Минимальная |
| MPEG-DASH | 6–30 с | Через стандартный HTTP-CDN | Не-Apple, через dash.js | Минимальная |
| RTMP (ingest) | 1–5 с на ingest | Не для воспроизведения | Все кодировщики | Средняя |
| SRT (ingest) | < 1 с на ingest | Не для воспроизведения | Растёт (профессиональные кодировщики) | Средняя |
Правило большого пальца: если один и тот же поток смотрит больше 5 000 пассивных зрителей, нужен HLS или LL-HLS через CDN. WebRTC SFU не раздаёт дёшево — каждый зритель занимает серверное соединение. Если нужны и интерактивность (небольшая группа спикеров), и масштаб (много зрителей), используйте WebRTC для спикеров и LL-HLS для остальных.
Выбор кодека: H.264 vs H.265 vs AV1 vs VP9
Выбор кодека — баланс трёх вещей: эффективность сжатия, поддержка устройств и стоимость кодирования. Неправильное умолчание стоит вам 30–50% на egress либо закрывает доступ старым устройствам.
| Кодек | Сжатие vs H.264 | Скорость кодирования | Поддержка устройств 2026 | Лицензионные сборы |
|---|---|---|---|---|
| H.264 / AVC | База | Самая высокая | Универсальная | Зрелый патентный пул |
| H.265 / HEVC | −40…−50% байт | В 3–5 раз медленнее | Широкая; слабее в старых браузерах | Сложно (несколько пулов) |
| AV1 | −55…−70% байт | В 5–10 раз медленнее | Растёт; только свежие чипсеты | Без лицензионных сборов |
| VP9 | −35…−45% байт | В 5 раз медленнее | Chrome/Android; на Apple нет live | Без лицензионных сборов |
| VP8 | −20% байт | В 2 раза медленнее | Уходит; только как WebRTC-фолбэк | Без лицензионных сборов |
Наши умолчания на 2026: H.264 — универсальный запасной вариант, H.265 — основной для современных устройств и live-трансляций, AV1 — только для длинного хвоста VOD, где экономия на хранении и egress за 3+ года явно перекрывает расходы на кодирование. Для WebRTC-конференций VP8 или H.264 остаются самым безопасным выбором для совместимости; VP9 и AV1 набирают вес, но клиентская поддержка всё ещё фрагментирована.
Управляемый SaaS vs кастомная сборка: экономика
Самая низкая ставка за минуту в 2026 году почти всегда у управляемой платформы. А самая низкая совокупная стоимость за 3 года — часто нет. Вот рабочая линия, по которой мы помогаем клиентам выбирать.
| Подход | Типичная стоимость | Срок выпуска | Кому подходит |
|---|---|---|---|
| Agora SDK | Тарифы по аудио/видео-юнитам | Дни | Быстрые MVP, голосовые приложения |
| Twilio Video | ~0,3 ₽ за минуту участника | Дни | Команды, уже сидящие на Twilio SMS/voice |
| LiveKit Cloud | ~3–3,7 коп. за минуту WebRTC | 1–2 недели | WebRTC-first SaaS, в 10 раз дешевле Twilio |
| Mux (live + VOD) | ~5 ₽/мин кодирование + ~1,8 ₽/мин доставка | Дни | Управляемый full-stack, средние и небольшие каталоги |
| Cloudflare Stream | ~375 ₽ за 1 000 мин хранения + 75 ₽ за 1 000 мин доставки | Дни | Самый экономный для небольшого VOD и коротких live |
| Self-hosted LiveKit + Hetzner | Только инфраструктура; никаких поминутных тарифов | 2–6 недель настройки | > 50 ТБ/мес egress, зрелая DevOps-команда |
| Кастомный mediasoup/Janus | Разработка + инфраструктура; никаких поминутных тарифов | 2–4 месяца | Дифференциация продукта в медиапути |
Логика точки безубыточности проста. Если вы сжигаете 1,5 млн ₽ в месяц на Twilio, self-hosted-кластер LiveKit на Hetzner может стоить на 70% меньше — но потребуется DevOps-инженер с зарплатой 9 млн ₽ в год. Выше ~600 тыс. ₽/мес на SaaS self-hosting окупается примерно за 18 месяцев. Ниже — продолжайте выпускать функции и не отвлекайтесь. Наш разбор альтернатив Agora и плейбук по LiveKit подробно показывают форму миграции.
Ловушка CDN и egress
Каждая стриминговая команда недооценивает egress. Закладывают 300–600 тыс. ₽/мес на хостинг и забывают, что один миллион зрительских минут 1080p при 5 Мбит/с — это около 37,5 ТБ исходящего трафика. По прайс-листу CloudFront это ~240 тыс. ₽. Помножьте на серьёзную аудиторию — и за месяц набегают семизначные суммы ещё до того, как бюджет утвердили.
Шпаргалка по ценам на egress (первые 10 ТБ/мес)
Bunny CDN: ~0,75–1,1 ₽/ГБ в Северной Америке и Европе. Cloudflare: фиксированно 375–1 500 ₽/ТБ через Stream или R2. AWS CloudFront: ~6,3 ₽/ГБ в Северной Америке, дороже в Европе и APAC. Hetzner: 20 ТБ включены в каждый бакет Object Storage, перерасход — ~0,07 ₽/ГБ.
Cache-hit ratio — ваш главный рычаг
95% cache-hit ratio означает, что CDN отдаёт 95 из 100 запросов, не касаясь вашего origin. 60% — что вы платите дважды: за egress origin и за egress CDN. Подбирайте TTL под тип контента (VOD: 24 часа и больше, live: длительность чанка плюс 1 с), используйте подписанные URL с общими ключами кэша и предзагружайте длинный хвост со своих топ-10 страниц.
Адаптивный битрейт как инструмент экономии
ABR — не только про качество для зрителя, но и про ваш кошелёк. Отдавать 720p тому, кто сидит на 3G, вместо принудительных 1080p — это минус 50% egress на этого пользователя. На миллионе минут в месяц это уже серьёзные деньги. Лесенка ABR должна быть даже в MVP.
DRM, шифрование и комплаенс
Безопасность в стриминге — это четыре слоя: транспортное шифрование, доступ по токенам, шифрование контента и DRM (управление цифровыми правами). Пропустите не тот слой — и либо утечёт контент, либо вы потратите бюджет на защиту, которая вам не нужна.
Транспорт и доступ
HTTPS везде, RTMPS для live-ingest, SRT с шифрованием для профессиональной подачи. Подписанные URL (CloudFront, S3 presigned, Cloudflare signed) держат анонимных зрителей подальше от origin. JWT-токены несут идентификацию зрителя и его права и должны жить минутами, а не часами.
Шифрование контента
AES-128 для HLS, CENC для DASH. Одно шифрование останавливает случайный парсинг, но не упорного пользователя с отладчиком. Для этого нужен DRM.
Управление цифровыми правами
Widevine (Google, бесплатная лицензия) покрывает Android, Chrome, Edge. FairPlay (Apple, бесплатно при developer-аккаунте) покрывает iOS, Safari, tvOS. PlayReady (Microsoft, платный) покрывает Windows и Xbox. Полноценное мульти-DRM-развёртывание обычно ставят на управляемый сервис вроде EZDRM (~15 тыс. ₽/мес), BuyDRM (от ~7 400 ₽/мес) или Drmtoday, которые держат сервера лицензий за вас — гораздо дешевле, чем хостить ключевую инфраструктуру самим. DRM можно пропустить для UGC-контента, инди-каталогов и внутренних платформ. Подключайте его, только когда этого требуют студии или правообладатели либо когда уличная стоимость контента явно оправдывает расходы.
Комплаенс — GDPR, HIPAA, SOC 2
Если продукт касается европейских зрителей, нужны карта данных по GDPR, политика хранения и сценарий экспорта данных. Телемедицина в США означает соглашения BAA уровня HIPAA с каждым провайдером инфраструктуры, сквозное шифрование и подписанные журналы доступа. SOC 2 — обязательный минимум для корпоративных SaaS-покупателей. Полный чек-лист — в нашем гайде по функциям безопасности стриминговых приложений.
Пороги масштаба: когда менять архитектуру
Архитектуры не масштабируются линейно. Есть резкие обрывы, на которых правильный выбор становится неправильным.
1. 6 участников → меняем P2P на SFU. Дальше шести mesh упирается в пользовательский интернет. Добавляйте SFU — LiveKit, mediasoup или Janus.
2. 500 одновременных потоков на SFU → кластеризуемся. Один узел SFU выдыхается на 500–1 000 активных потоков. Дальше — региональные SFU-кластеры с каскадированием и балансировщик сигнальных запросов.
3. 5 000 пассивных зрителей → переходим на LL-HLS. Раздача через WebRTC — затратное по CPU удовольствие. Гибридные архитектуры пускают спикеров через WebRTC и параллельно отдают LL-HLS-копию длинному хвосту зрителей через CDN.
4. 50 ТБ/мес egress → пересогласовываем CDN. На CloudFront включаются объёмные скидки; Bunny, Cloudflare и Hetzner становятся ощутимо дешевле. Подключение второго CDN окупает дополнительную инженерию.
5. 100 тыс. одновременных зрителей → multi-region origin. Один origin во Франкфурте, раздающий live-стрим на 100 тыс. зрителей по миру, ляжет под нагрузкой TLS-хендшейков. Реплицируйте origin, используйте Anycast DNS и держите наготове runbook на отказ.
Жжёте бюджет на CloudFront или Twilio?
Мы регулярно аудируем стриминговые счета — у большинства клиентов после смены протокола или CDN экономия 30–70%. Запишитесь на ревью.
Мини-кейсы: чему нас научили реальные платформы
BrainCert пришёл в Фора Софт с LMS для виртуальных классов, которой нужно было масштабировать HD-видео и аудио на школы и центры тестирования по миру. Мы построили WebRTC-конференц-стек на 40-ядерных медиасерверах, распределённых по 10 дата-центрам. Сегодня платформа раздаёт 500 млн+ минут live-видео, обслуживает 100 тыс.+ клиентов и собрала четыре награды Brandon Hall Award.
VALT — SaaS для видеонаблюдения, который мы сделали для 770+ организаций в США. Он раздаёт full-HD-потоки с IP-камер Axis по RTMPS, поддерживает мгновенное воспроизведение, ролевый доступ, мониторинг нескольких камер в live и экспорт доказательной базы. Сегодня 50 тыс.+ активных пользователей опираются на него каждый день в задачах правоохранения, медицины и защиты детей.
Speed.Space — платформа удалённого видеопроизводства, которую Фора Софт построила для распределённых съёмочных групп. Захват идёт в 1080p при 8 Мбит/с — примерно впятеро качественнее обычной конференции — до 25 участников и без простоев. Среди клиентов — Netflix, HBO, EA и продакшены, показанные на Парижской неделе моды. Хотите аналогичную оценку для своего стека? Свяжитесь с нами — разберём миграцию за 30 минут.
Модель стоимости: как выглядит реальная оценка
Вот как мы скоупим стриминговые проекты в Фора Софт. Это реальные диапазоны, которые мы выдерживаем в коммерческих предложениях, сжатые за счёт Agent Engineering — большинство агентств называют в 1,5–2 раза больше за тот же объём.
| Объём | Срок | Что выпускается |
|---|---|---|
| VOD MVP | 4–6 недель | Веб + iOS/Android-плеер, HLS + ABR, Mux или Cloudflare Stream, базовый поиск и аутентификация |
| Live-стриминг MVP | 8–12 недель | RTMP/SRT ingest, LL-HLS-проигрывание, CDN, чат, запись в VOD |
| Конференц-MVP | 6–10 недель | SFU на LiveKit или mediasoup, комнаты, simulcast, запись, скриншаринг |
| Премиальная стриминговая платформа | 4–6 месяцев | VOD + live + подписка + DRM + аналитика + SSO + админ-бэкофис |
| Корпоративный мультитенант | 6–12 месяцев | Multi-region, мультиязычность, white-label, SSO, HIPAA/SOC 2, AI-функции |
Инфраструктура обычно добавляет от 37 тыс. до 375 тыс. ₽/мес для небольшого продукта и 375 тыс.–3,7 млн ₽/мес после нескольких тысяч одновременных потоков. Разбивка по модулям — в нашей статье о стоимости разработки видеостримингового приложения, а математику по типичным конфигурациям мы даём в гайде по оценке стоимости сервера.
Схема принятия решения: выберите стек за пять вопросов
До того как покупать SDK или фиксировать CDN, ответьте на эти пять вопросов письменно. Ответы каскадно ложатся в архитектуру.
В1. Какая максимально допустимая задержка? Меньше 500 мс — вы вынуждены брать WebRTC. 2–5 с — допускает LL-HLS. 10–30 с — самый широкий и дешёвый вариант через HLS/DASH.
В2. Сколько одновременных зрителей на пике? До 5 000 одновременно можно оставаться на WebRTC. Выше 5 000 — обязательно подключайте CDN и HTTP-нарезку.
В3. Зритель платит, и за что? Бесплатный тариф с рекламой терпит более низкое качество; платные подписчики ждут минимум 1080p и мгновенный старт. Корпоративные покупатели ждут SSO, DRM и журналы аудита.
В4. Сколько вы готовы платить за egress в месяц? Прикидка на салфетке: 1 млн минут 1080p ≈ 37,5 ТБ. Умножьте на цену за ГБ — получите нижнюю границу.
В5. Есть ли в штате DevOps-инженер? Нет → оставайтесь на управляемых сервисах (Mux, Cloudflare Stream, LiveKit Cloud). Да → self-hosting становится осмысленным, когда счёт за SaaS переваливает ~600 тыс. ₽/мес.
Пять ловушек, которые топят стриминговые проекты
1. Выбор WebRTC для пассивной массовой раздачи. WebRTC прекрасен для интерактивного сценария с задержкой меньше секунды, но стоимость сервера на одного зрителя ломает экономику на масштабе. Если 10 тыс. зрителей смотрят одного автора, правильный ответ — LL-HLS, даже если задержка будет на 3 с больше.
2. Один битрейт на весь поток. Один вариант 1080p на 5 Мбит/с означает, что любой с мобильным или слабым Wi-Fi будет ребуферить. Всегда отдавайте лесенку ABR — минимум 4 варианта — либо смиритесь с потерей 25% зрителей из-за ребуферинга.
3. Игнорирование cache-hit ratio. 60% cache-hit ratio на вашем CDN означает, что вы платите дважды — за egress origin и за egress CDN. Лекарство — длинные TTL, подписанные URL с общими ключами и origin shield. Мы видели, как команды экономили 50% счёта за CDN за два дня конфигурационной работы.
4. Пишут собственный SFU с нуля. mediasoup, LiveKit, Janus и Jitsi — зрелые, обкатанные в бою, open-source. Свой SFU с нуля — это 6–12 месяцев элитной инженерии до первого продакшен-звонка. Делайте форк или стройте поверх; не изобретайте заново.
5. Нет мониторинга QoS. Невозможно оптимизировать то, чего не видно. С первого дня инструментируйте битрейт доставки, успешность подключения, частоту фризов, TTFF (time to first frame) и долю ребуферинга. Prometheus + Grafana для серверных метрик, QoS-маячок из плеера для клиентских. Без них вы отлаживаете вслепую.
KPI: что измерять
KPI качества. Цель: time-to-first-frame (TTFF) ниже 2 с, доля ребуферинга меньше 0,5%, средний битрейт выше 70% от верхнего варианта по сессии. Для конференций — джиттер меньше 30 мс и RTT меньше 150 мс в пределах региона.
Бизнес-KPI. Время просмотра на активного пользователя, доля досмотра, конверсия из триала в платный тариф и churn на 30/60/90 дней. Для live — пиковое число одновременных зрителей, среднее время просмотра, количество шерингов в соцсети. Если монетизируетесь подпиской — отслеживайте LTV/CAC и стоимость одного просмотренного часа: именно последнее число волнует вашего CFO.
KPI надёжности. Доля успешных подключений выше 99%, аптайм выше 99,9%, mean time to detect (MTTD) для отказов ingest — меньше 5 минут, cache-hit ratio выше 92% для VOD и 85% для live. Пороги алертов задавайте ниже целевых значений, а не на них.
Когда НЕ нужно строить своё стриминговое приложение
Не каждая стриминговая идея требует своего ПО. Если всё, что вы делаете, — это раздача на Facebook, Instagram и YouTube, используйте их встроенный стек. Если у вас внутренние вебинары на 500 человек пару раз в квартал, Zoom или Google Meet дешевле всего, что вы можете построить.
Стройте кастомно, когда выполняется одно из четырёх условий: (1) ваш продукт встраивает видео в дифференцированный воркфлоу (телемедицина, live-шопинг, отраслевой инструмент совместной работы); (2) комплаенс или брендинг требуют полного контроля над медиапутём; (3) ваша юнит-экономика работает только на масштабе, который не даёт ни один SaaS; (4) сам видеоопыт и есть продукт, а не его обёртка. Если ни одно условие не выполняется, готовый SaaS плюс ваша прикладная логика — почти всегда правильный выбор.
FAQ
Сколько времени занимает создание MVP видеостримингового приложения?
Сфокусированный VOD-MVP выпускается за 4–6 недель. Live-стриминговому MVP нужно 8–12 недель: вы добавляете ingest, транскодирование в реальном времени и раздачу. Конференц-MVP с SFU на WebRTC укладывается в 6–10 недель. Благодаря Agent Engineering Фора Софт обычно выходит к нижней границе этих диапазонов.
WebRTC — всегда ли правильный выбор для стриминга с низкой задержкой?
Только для двунаправленных или интерактивных сценариев с задержкой меньше секунды. Для раздачи «один ко многим», где достаточно задержки до 5 с, LL-HLS дешевле, масштабируется через любой HTTP-CDN и работает на большем числе устройств. Полезная эвристика: WebRTC — для разговоров, LL-HLS — для трансляций.
Что использовать в 2026: H.264, H.265 или AV1?
H.264 как универсальный запасной вариант. H.265 (HEVC) как основной для современных устройств — он сокращает байты на 40–50%. AV1 только для длинного хвоста VOD-каталогов, где экономия на egress за 3+ года оправдывает кодирование, которое в 5–10 раз медленнее. Для конференций VP8 или H.264 остаются самым безопасным WebRTC-выбором.
Сколько реально стоит видеостриминговое приложение?
Разработка масштабируется со скоупом: VOD-MVP укладывается в нижнюю границу семизначных бюджетов в рублях, премиальная мультимодульная платформа — в середине восьмизначных. Месячная инфраструктура — от нескольких десятков тысяч рублей для ранних продуктов до миллионов для приложений на масштабе. Подробный разбор — в нашей статье о стоимости разработки видеостриминговых приложений.
Нужен ли DRM моей стриминговой платформе?
Только если вы распространяете контент с лицензией от студий, этого требуют ваши контракты, или уличная стоимость контента явно оправдывает ~7–37 тыс. ₽/мес за управляемый DRM-сервис. Для большинства инди-авторов, UGC и внутреннего корпоративного видео подписанных URL плюс AES-шифрования хватает по защите за долю той же цены.
Можно ли мигрировать с Agora или Twilio, чтобы сэкономить?
Да — как только счёт переваливает примерно 375–600 тыс. ₽/мес, миграция на LiveKit Cloud или self-hosted LiveKit/mediasoup обычно экономит 60–90% поминутной стоимости. Шаблон миграции и компромиссы мы разбираем в нашем гайде по альтернативам Agora.
Какой CDN выбрать для стримингового приложения?
Для большинства новых продуктов до 10 ТБ/мес Cloudflare Stream или Bunny CDN дают лучшее соотношение цена/производительность. Выше 50 ТБ/мес связка из нескольких CDN — CloudFront + Bunny (или Hetzner в качестве origin за Bunny) — резко режет egress. Всегда отслеживайте cache-hit ratio: соотношение 90%+ важнее, чем выбор конкретного провайдера.
Какой максимальный размер встречи на SFU?
Один правильно настроенный узел SFU тянет 500–1 000 активных потоков — примерно 50 участников, каждый из которых публикует два слоя simulcast и подписан на 10 видимых плиток. Для более крупных событий собирайте SFU в кластеры по регионам с каскадированием. Математика масштабирования — в нашем разборе P2P vs MCU vs SFU.
Что почитать дальше
Стоимость
Разбор стоимости видеостримингового приложения
Помодульная разбивка цены для VOD-, live- и конференц-сборок.
Архитектура
P2P vs MCU vs SFU
Где побеждает каждая топология и почему гибрид обычно прав.
Протокол
WebRTC vs HLS для стриминга
Задержка, масштаб и компромиссы по стоимости простым языком.
Масштаб
Масштабирование стримингового приложения
Как провести стриминговый продукт от тысячи до миллиона зрителей.
Миграция
Альтернативы Agora.io в 2026
LiveKit, mediasoup, Jitsi и Janus с разбором по экономике.
Готовы выпустить своё видеостриминговое приложение?
Что отличает выигравшие стриминговые продукты от заглохших — не самый модный кодек и не самый передний протокол. Это честный ответ на пять вопросов: какая нужна задержка, сколько зрителей на пике, что вы можете позволить себе на egress, кто платит за контент и кто эксплуатирует инфраструктуру. Как только эти ответы зафиксированы, стек складывается сам.
Фора Софт с 2005 года выпустила 625+ продуктов в этой нише: телемедицина, виртуальные классы, удалённое видеопроизводство, трейдерский стриминг, SaaS для видеонаблюдения. Если вы стартуете стриминговый проект или хотите второе мнение по тому, что уже в работе, — обычно 30-минутного звонка достаточно, чтобы сэкономить недели неверных решений.
Стартуете или перестраиваете стриминговый продукт?
Расскажите нам сценарий — набросаем архитектуру, модель стоимости и сроки за 30 минут. Без питч-дека, только доска.
