
Главное
• Стриминг с задержкой меньше секунды и стриминг с задержкой 5 секунд — это разные продукты. Ниже 500 мс — это территория WebRTC (телемедицина, ставки в прямом эфире, видеоконференции). От 0,5 до 3 с — LL-HLS / DASH. Свыше 3 с — классический HLS-бродкаст. Протокол определяет продукт.
• Задержка — это бюджет, а не функция. Сквозная задержка — это сумма захвата, кодирования, упаковки, сети, CDN, буфера плеера и отображения. Если вы выходите за бюджет на любом из этапов, стрим уже не тот. Поэтому и чинить нужно конкретный этап.
• WebRTC + SFU — стандарт 2026 года для интерактива. P2P для 2–4 пользователей, SFU для 5–500, MCU — только когда серверное смешивание на CPU обязательно. На масштабе побеждает гибридная схема.
• На стоимость влияют кодек и CDN, а не протокол. HEVC снижает битрейт на 40–50% по сравнению с H.264; AV1 — ещё на 20–30%, но обходится в 2–3× дороже по кодированию. CDN с поддержкой edge-доставки (Cloudflare, Fastly) удерживают p95-задержку под нагрузкой.
• Большинство команд переплачивают на 30–50%. Неверный протокол, не тот тариф CDN, неверный буфер плеера, неоптимальная лестница битрейтов. Честный аудит за неделю обычно окупается в 3 раза за первый год.
По теме: читайте наш полный гид по UX-практикам стримингового приложения — «7 опор UX для стримингового сервиса (2026)».
«Стриминг с низкой задержкой» для разных продуктов означает разное. Кардиологу на сеансе телемедицины нужны 200 мс. Платформе живых аукционов — 400 мс. Спортивному вещателю — меньше 3 секунд. Кулинарному шоу в соцсетях — меньше 10. Любую из этих задач можно решить, но у каждой — своя архитектура, своя экономика и свои узкие места.
Этот гид написан для CTO, продуктовых менеджеров и стриминговых инженеров, которые проектируют или эксплуатируют продукт живого видео в 2026 году. Мы разбираем реальный сквозной бюджет задержки, три «коридора» протоколов (WebRTC / LL-HLS / классический HLS), выбор кодека и CDN, которые формируют стоимость, и пять ловушек, на которых чаще всего срываются SLA. Цифры и схемы отражают то, что наши команды и коллеги по индустрии запускают сегодня на уровне Netflix, HBO и доказательного видео.
Почему этот гид написала Фора Софт
Компания Фора Софт разрабатывает видеосервисы с 2005 года — более 625 проектов, и стриминг в реальном времени для нас одна из ключевых компетенций. Мы построили Speed.Space, платформу удалённого видеопроизводства, которая отдаёт 1080p при 8 Мбит/с (примерно 5× от стандартного битрейта видеозвонка), чтобы режиссёры на проектах для Netflix, HBO и EA могли монтировать материал в день съёмки. Мы запустили V.A.L.T — платформу доказательного видео, которой пользуются более 700 ведомств и где потери при стриминге недопустимы.
Низколатентный стриминг — это системная задача с физическим потолком. Скорость света на трансконтинентальном хопе даёт около 40 мс в одну сторону. Всё остальное — кодирование, упаковка, буфер плеера, логика повторных запросов — должно уложиться в тот лимит интерактивности, который задаёт ваш продукт. Команды, которые умеют это делать, провели годы в этом слое. Команды, которые начинают с нуля, обычно проходят эти уроки заново.
Мы применяем Agent Engineering на каждом проекте — это позволяет нашим MVP выходить за недели, а не за кварталы. Соответственно, оценки ниже в статье обычно лежат ниже отраслевых, и мы честно отмечаем те моменты, где цифра может качнуться в обе стороны.
Проектируете стриминговый сервис с низкой задержкой?
Пришлите размер аудитории, целевую задержку и предполагаемый стек. За 30 минут мы разложим задачу на WebRTC / LL-HLS / HLS и дадим оценку в неделях.
Что такое «низкая задержка» на самом деле — сквозной взгляд
Задержка «от стекла до стекла» (glass-to-glass) — это сумма всех этапов между сенсором камеры и экраном зрителя. Большинство команд измеряют один-два этапа и упускают реальную сквозную цифру. Имеет смысл выделить три уровня:
- Интерактив (< 500 мс): телемедицина, ставки в прямом эфире, видеоконференции, удалённое видеопроизводство, живые аукционы. Территория WebRTC.
- Близкий к реальному времени (0,5–3 с): спорт, новости, киберспорт со синхронизированным чатом, лайв-коммерс. LL-HLS / LL-DASH / CMAF.
- Классический бродкаст (3–30 с): массовый OTT, повторы в соцсетях, SVOD-премьеры. Стандартный HLS / DASH.
Меньше 100 мс — это уже физический предел: трансконтинентальный путь в одну сторону — примерно 40 мс ещё до любого кодирования, плюс 80 мс на круговой обмен, плюс кодирование и декодирование — и вы упираетесь в жёсткий пол. Свыше 30 секунд задержка — это уже продуктовое решение (распределение по типу VOD), а не технологическое ограничение.
Реальный бюджет задержки по этапам
Разбиение сквозной задержки на измеримые этапы — то, без чего ни один быстрый стриминговый пайплайн не запускается. Вот цифры, на которые мы целимся в продакшен-связке WebRTC + CDN:
| Этап | WebRTC (интерактив) | LL-HLS (близко к реальному времени) | Классический HLS (бродкаст) |
|---|---|---|---|
| Захват + кодирование | 20–60 мс | 50–200 мс | 200–1 000 мс |
| Упаковка | н/п (поток кадров) | 200–400 мс (CMAF-чанки) | 2–6 с (сегменты) |
| Сеть до CDN | 20–80 мс | 50–150 мс | 100–300 мс |
| Раздача с CDN | н/п (SFU напрямую) | 50–200 мс | 200–500 мс |
| Буфер плеера | 20–100 мс (джиттер) | 500–2 000 мс | 6 000–30 000 мс |
| Декодирование + отображение | 10–30 мс | 30–60 мс | 30–60 мс |
Буфер плеера — самая «гуляющая» переменная. На практике LL-HLS уходит ниже секунды только при тонкой настройке плеера; ненастроенный HLS.js или Shaka Player и на LL-HLS-фиде сидит ближе к 6 секундам.
WebRTC: коридор интерактива
WebRTC — единственный протокол, который стабильно даёт меньше 500 мс «от стекла до стекла» во всех браузерах и на мобильных устройствах 2026 года. И это до сих пор правильный выбор по умолчанию, когда аудитория небольшая, а взаимодействие двустороннее.
P2P. Самая лёгкая топология, медиапоток идёт без сервера. Чисто работает до 4–6 пользователей; дальше упирается в CPU и канал, потому что каждый клиент отдаёт поток всем остальным.
SFU (Selective Forwarding Unit). Стандарт 2026 года. Один входящий поток, много исходящих, сервер ничего не декодирует. Масштабируется от 5 до примерно 500 участников в комнате, пока стоимость CPU не выходит из берегов. Из распространённых стеков — LiveKit, Mediasoup, Janus; из управляемых сервисов — Agora, Daily и LiveKit Cloud.
MCU (Multipoint Control Unit). Серверное смешивание в один поток. Жрёт CPU, но даёт один общий «холст» для записи или бродкаста. Брать только когда выбора нет (легаси-клиенты, запись в один файл, исходящий бродкаст из MCU).
Гибрид. SFU для интерактивной части и отдельная HLS / LL-HLS-лестница для пассивной аудитории. Именно так на масштабе работают лайв-коммерс, киберспорт и вебинарные продукты.
Наш гид по архитектуре WebRTC на 2026 год разбирает каждую из этих топологий с эталонными цифрами и сценариями, где какая выигрывает.
Выбирайте WebRTC + SFU, если: размер комнаты — меньше 500 участников, и опыт интерактивный. Параллельно подключайте симулькаст HLS для пассивного миллиона, а интерактивную «вершину воронки» держите на SFU.
LL-HLS и LL-DASH: коридор, близкий к реальному времени
Low-Latency HLS и LL-DASH опускают HTTP-стриминг с 6–30 секунд до 1–3 секунд: сегменты ужимаются до CMAF-чанков (200–400 мс), а HTTP/2 push и preload-хинты отдают их плееру сразу по мере появления.
Где LL-HLS выигрывает. Спорт, новости, киберспорт, лайв-коммерс, живые аукционы с большой аудиторией. Сохраняется охват CDN, как у HLS, и при этом задержка действительно приемлема, когда чат синхронизирован с видео.
Где он буксует. Двусторонняя коммуникация (берите WebRTC), очень слабые сети, где загрузка сегментов спотыкается (нужна адаптивная лестница или откат на стандартный HLS), а также старые версии Safari с неполной поддержкой LL-HLS.
Настройка плеера. Дефолтная конфигурация HLS.js даже на LL-HLS даёт задержку около 6 с. Три ручки, которые решают: целевой буфер 0,9–1,2 с, размер чанка 200 мс и агрессивная упреждающая подгрузка фрагментов. У Shaka Player и THEOplayer LL-HLS-режимы уже зрелые; dash.js делает то же самое для DASH.
Выбирайте LL-HLS, если: аудитория — от 10 тыс. одновременных пользователей на Safari и мобильных, важна синхронизация чата, и задержка 1–2 с допустима. WebRTC на такой аудитории при пассивном опыте — перебор.
Классический HLS / DASH: бродкаст-распределение
Стандартный HLS с шестисекундными сегментами и буфером в 3 сегмента даёт около 18 секунд «от стекла до стекла». DASH с похожими сегментами идёт примерно так же. Это самый дешёвый вариант в пересчёте на одного одновременного зрителя, потому что CDN берёт на себя всю раздачу, а на origin нет обратного давления.
Брать его стоит, когда продукт не завязан на интерактив, важны DVR-функции (перемотка, повтор), а распределение — глобального масштаба. Хорошо собранная лестница HLS (3–5 битрейтов, 720p / 1080p / 4K) обслуживает миллионы за копейки на зрителя-час.
Кодеки: H.264, HEVC, AV1
Выбор кодека бьёт по бюджету дважды — стоимостью кодирования (циклы CPU/GPU) и стоимостью доставки (биты в канале). В 2026 году у вас три реальных варианта:
| Кодек | Битрейт vs H.264 | Стоимость кодирования | Поддержка устройств (2026) | Когда брать |
|---|---|---|---|---|
| H.264 (AVC) | базовый уровень | 1× | Универсальная | Дефолт для WebRTC, легаси-устройства |
| HEVC (H.265) | на 40–50% ниже | 1,5–2× | Apple + большинство Android и Smart TV | Премиум-OTT, HDR |
| AV1 | на 60–70% ниже | 2–3× (SW), ~1,5× с аппаратным кодером | Растёт (Chromium, новые Apple и Android) | Длинный OTT, архивы |
Для WebRTC в 2026 году H.264 остаётся безопасным дефолтом: аппаратное декодирование на всех устройствах и универсальная совместимость с SFU-релеями. HEVC раскачивается на свежих стеках Chromium и Apple. AV1 — правильная ставка для длинного OTT, где стоимость кодирования размазывается на миллионы зрителей, но в реал-тайм интерактиве это пока преждевременно.
Выбирайте AV1, если: аудитория — от 1 млн одновременных зрителей премиум-контента, и вы можете позволить себе кодирующую ферму в 2–3× большую. В остальных случаях HEVC даёт 90% экономии при трети затрат.
CDN и edge: где решается p95-задержка
Средняя задержка хорошо продаётся; удерживают клиентов цифры p95 и p99. Именно на уровне CDN и edge большая часть хвостовой дисперсии либо удерживается, либо вырывается наружу.
Cloudflare. Anycast, глобальное покрытие, агрессивное кэширование, HTTP/3 первого класса. Хорош для LL-HLS/DASH и общей доставки видео. Продукт Stream предоставляет WebRTC-стриминг на масштабе.
Fastly. Программируемый edge (VCL / Compute). Отлично подходит для лайв-DVR, персонализированной рекламы и любых сценариев с edge-логикой на медиапути.
AWS CloudFront + MediaLive / MediaPackage. Вариант «всё в одном», когда остальная инфраструктура уже в AWS. MediaLive занимается кодированием, MediaPackage — упаковкой «на лету».
Akamai / Limelight. До сих пор законодатели мод в премиум-бродкасте корпоративного масштаба. Лучшие p95-показатели во многих регионах — за премиум-цену.
Edge-вычисления. Cloudflare Workers, Fastly Compute@Edge и Lambda@Edge позволяют запускать упаковку и just-in-time кодирование рядом со зрителем. Именно так LL-HLS на масштабе попадает в свои меньше 2 секунд. Подробнее про это — в нашем гиде по edge-вычислениям для лайв-стриминга.
Выбирайте edge-упаковку, если: цель по p95 ниже 2 с на LL-HLS глобально. Упаковка только на origin — именно тот сценарий, в котором p95-задержка тихо утраивается на втором континенте.
Мини-кейс: 1080p при 8 Мбит/с для удалённого видеопроизводства
Задача. Speed.Space — платформа удалённого видеопроизводства, которую мы построили, — должна была отдавать 1080p при 8 Мбит/с (примерно 5× от стандартного битрейта видеозвонка) продакшен-командам, которые монтируют материал в день съёмки. Режиссёрам нужно было превью с задержкой меньше секунды; монтажёрам — запись в полном качестве; колористам — HDR-метаданные, доживающие до конца цепочки.
План на 12 недель. Мы разделили стек на превью-путь на WebRTC для интерактивного просмотра, параллельную лестницу записи под постпродакшен и цепочку HEVC + HDR10-метаданных для цвета. Главное узкое место решили переносом тонмаппинга на GPU устройства — задержка упала примерно на 40% по сравнению с тонмаппингом на edge-ноде. Слой WebRTC — наша родная территория с 2005 года — запустился точно в срок.
Результат. До Speed.Space постпродакшен ждал «дейлис» по нескольку часов; после — стали монтировать вживую при 5× битрейте. Урок для низколатентного стриминга прямой: оптимизируйте этап с самым большим бюджетом, а не тот, который проще измерить. Хотите такой же разбор вашего пайплайна? Позвоните или напишите нам.
Стрим не укладывается в SLA по задержке?
За неделю проведём аудит по этапам: захват, кодирование, упаковка, CDN, буфер плеера — и отдадим приоритизированный список фиксов с оценкой в неделях.
Рамка для выбора стримингового коридора — пять вопросов
1. Опыт интерактивный? Если зритель говорит в ответ, кликает в реальном времени или принимает решения, опирающиеся на обратную связь меньше секунды, — вы на территории WebRTC. LL-HLS можно пропустить.
2. Какой профиль одновременной нагрузки? Меньше 500 одновременных интерактивных участников — SFU справится. Свыше 500 при преимущественно пассивной аудитории — гибрид SFU + HLS. Свыше 50 тыс. — ведущим становится HLS / LL-HLS.
3. Какая допустимая задержка по p95? Именно p95, не среднее — хвост важнее. LL-HLS на плохо настроенных плеерах может давать медиану 2 с и p95 6 с. Бюджетируйте хвост явно.
4. Какое распределение по устройствам? Преобладает Chromium — AV1 и HEVC жизнеспособны. Преобладает Safari — LL-HLS безопаснее, чем только DASH. Старые Smart TV — остаётся классический HLS или HEVC.
5. Как выглядит запись и DVR? Если зрители перематывают, источником истины должны быть LL-HLS / HLS. WebRTC — это превью-слой; при необходимости комбинируйте.
Пять ловушек, которые съедают стриминговые кварталы
1. Измерять только среднюю задержку. Зрители замечают хвост. Снимайте p95 и p99 на каждой сессии, а не синтетику с офисной сети.
2. Дефолтные настройки плеера в продакшене. HLS.js, Shaka, dash.js выходят с консервативными буферами. LL-HLS без настройки плеера не отличить от классического HLS.
3. Не тот кодек под аудиторию. AV1 на Safari-аудитории означает фолбэк-транскодирование на каждом потоке; HEVC на Chromium-аудитории — упущенную экономию по сжатию. Сначала измерьте микс устройств, потом фиксируйте кодек.
4. Экономия на CDN. Экономия 1,5 млн ₽ в год на CDN превращается в 150 млн ₽ оттока, когда p95-задержка прыгает на пиковом событии.
5. Нет фолбэка. WebRTC блокируется корпоративными файрволами, LL-HLS заикается на слабых сетях. Каждый лайв-продукт нуждается в плавной деградации — вплоть до простого HLS, — иначе саппорт всю жизнь отвечает «стрим лежит».
KPI: что мерить после релиза
Качество. Сквозная задержка «от стекла до стекла» по p95 и p99 в каждом регионе; доля ребуферизации (планка — меньше 1%); время старта (цель — меньше 2 с); распределение по битрейтам отдачи; процент сбоев по плеерам и устройствам. Снимать с клиента, не с origin.
Бизнес. Время сессии, отвалы на 1-й, 5-й, 15-й минуте, пиковая одновременная нагрузка, конверсия «зритель → действие», стоимость CDN на зрителя-час. С первого дня привяжите дашборд к северной звезде продукта.
Надёжность. Время доступности больше 99,9% для лайв-событий, доля брошенных стримов меньше 5%, время переключения на резервный CDN меньше 30 с, сквозной мониторинг на каждой PoP. Без этого первое разочаровывающее событие становится и последним.
Экономика: сколько на самом деле стоит лайв-видео
Три порядковых ориентира по стоимости одного одновременного зрителя-часа. Реальные цифры пляшут от кодека, контракта с CDN, лестницы битрейтов и микса регионов.
WebRTC SFU. 0,15–0,75 ₽ за участника-минуту на собственном кластере Jitsi/Mediasoup/LiveKit; в 2–4× дороже на управляемых сервисах (Agora, LiveKit Cloud) за готовую эксплуатацию. Стоимость растёт за CPU на SFU и за исходящий трафик.
LL-HLS на Cloudflare Stream / AWS MediaPackage. 0,22–0,60 ₽ за зрителя-час на типичном 720p; HEVC снимает 30–40% линии трафика.
Классический HLS (глобальный CDN). 0,07–0,22 ₽ за зрителя-час на больших объёмах — ожидаемо самый дешёвый тариф.
Кастомная разработка поверх этих цифр окупается, когда нужен брендированный плеер, DRM (Widevine / FairPlay / PlayReady), уникальные функции или плотная интеграция с существующим бэкендом. На Agent Engineering мы ужимаем инженерную линейку таких проектов; диапазоны, не обещания.
Когда кастомная разработка низколатентного стриминга не нужна
Четыре сценария, где готовое решение выигрывает у разработки на заказ:
1. Обычные видеоконференции. Если продукт — клон Zoom, берите Zoom SDK, Daily или LiveKit Cloud. Кастомный SFU + пайплайн кодеков окупается только тогда, когда опыт ощутимо отличается.
2. Небольшая аудитория. До 10 тыс. одновременных зрителей в пике управляемый LL-HLS-сервис дешевле полной стоимости владения собственным кодером и CDN.
3. Нет внутренней экспертизы по видео. У реал-тайм-стриминга длинный хвост операционной работы — смена кодеков, переговоры с CDN, браузерные особенности, ротация DRM. Без владельца кастомная разработка деградирует.
4. Целевая задержка от 5 с и выше. Классический HLS на коммодити-CDN — правильный ответ; оптимизировать ниже нечего.
Нужно второе мнение по стриминговой архитектуре?
Мы запускали этот стек — WebRTC, LL-HLS, HEVC, edge-упаковку — на уровне Netflix, HBO и доказательного видео. Расскажите, в чём узкое место.
Соответствие требованиям и безопасность: DRM, GDPR, HIPAA
DRM. Widevine (Google), FairPlay (Apple), PlayReady (Microsoft) закрывают три платформы. Мульти-DRM-упаковка — стандарт; большинство управляемых сервисов (BuyDRM, ExpressPlay, AWS) сами заботятся о ротации ключей.
Шифрование. SRTP в WebRTC — минимум. CMAF CBCS / CENC для HLS/DASH. TLS 1.3 везде; сквозное шифрование доступно в LiveKit, Daily и Zoom для особо чувствительных сценариев.
GDPR и HIPAA. Для телемедицины HIPAA BAA с провайдером SFU — обязателен; GDPR заталкивает большинство европейских видеопотоков на региональные PoP с соглашением об обработке данных. Анализ по Schrems II — до сих пор правильная отправная точка для любых стриминговых продуктов с европейско-американскими потоками данных.
Приватность и запись. Юрисдикции отличаются: где-то достаточно согласия одной стороны, где-то требуется согласие двух (в США это меняется от штата к штату), под GDPR — явное согласие. Закладывайте это в UX, а не пристёгивайте сверху.
Чек-лист интеграции: до старта инженерии
Зафиксируйте пять решений до начала написания ТЗ — иначе каждое из них съест недели уже в ходе разработки.
- Целевая задержка (p95, не медиана). Назовите цифру; назовите способ измерения.
- Пиковая одновременная нагрузка и география. От этого зависит выбор CDN и регионов.
- Решение по кодекам. H.264 / HEVC / AV1 — один или несколько в лестнице. Микс устройств определяет выбор.
- Плеер. Свой или Shaka / HLS.js / video.js / нативный. Решение сейчас экономит недели QA позже.
- Запись и DVR. Меняет всё — от упаковки до хранения.
Тренды, которые изменят стриминг до 2027 года
Сближение WebRTC и HTTP/3. WebTransport на базе QUIC начинает забирать трафик, который раньше был только за WebRTC; лучше ведёт себя по head-of-line-blocking на пакетной передаче медиа.
AV1 в аппаратуре повсюду. На iPhone и флагманских Android аппаратное декодирование AV1 уже целый цикл; в 2026–27 годах оно доезжает до Smart TV и приставок. Экономия трафика наконец проявляется в счетах.
AI-усиленные потоки. Живые субтитры, синхронный перевод, super-resolution, маскировка фона, модерация — всё чаще работает инлайн. Наш гид по обработке видео в реальном времени с AI разбирает паттерны интеграции.
Edge-рендеринг персонализации. Вставка рекламы, оверлеи, интерактивные слои отрисовываются в Cloudflare Workers / Fastly Compute at Edge рядом со зрителем. Задержка держится честной, а персонализация работает.
Иммерсивные стримы для Vision Pro и Quest 3. HDR10 поверх WebRTC становится не экспериментом, а заявленной функцией. Пространственный звук подтягивается в общий пакет.
FAQ
Что считать «низкой задержкой» в видеостриминге?
На практике три уровня. Интерактив (< 500 мс) — территория WebRTC: телемедицина, живые аукционы, видеоконференции. Близко к реальному времени (0,5–3 с) — LL-HLS / LL-DASH: спорт, лайв-коммерс, новости. Классический бродкаст (3–30 с) — стандартный HLS / DASH: массовый OTT. Протокол и продукт жёстко связаны.
WebRTC или LL-HLS — что выбрать?
WebRTC, если аудитория — до ~500 одновременных участников и опыт интерактивный. LL-HLS, если нужно CDN-масштабное распределение с задержкой, близкой к реальному времени, для большой пассивной аудитории. Большинство продуктов в итоге уходят в гибрид: WebRTC — для интерактивной вершины, LL-HLS или HLS — для широкого бродкаст-хвоста.
Брать ли AV1 в 2026 году?
Для длинного OTT на Chromium-аудитории — всё чаще да: AV1 снимает 60–70% трафика по сравнению с H.264, аппаратное декодирование уже распространено. Для интерактивных WebRTC-продуктов в реальном времени H.264 остаётся безопасным дефолтом 2026 года из-за универсальной поддержки SFU и браузеров; HEVC — следующий шаг.
Как опустить задержку LL-HLS ниже 2 секунд на практике?
Уменьшите CMAF-чанки до 200 мс, выставьте целевой буфер плеера 0,9–1,2 с, используйте HTTP/2 push или preload-хинты и разворачивайте упаковщик на edge (Cloudflare, Fastly, CloudFront с Lambda@Edge). Все четыре пункта вместе стабильно дают около 1,2–1,8 с «от стекла до стекла» на современных плеерах.
Сколько занимает разработка низколатентного стриминга?
Сфокусированный MVP на WebRTC — захват, SFU, веб- и мобильный плеер, запись на диск — выходит за 8–12 недель с командой, которая регулярно делает видео в реальном времени. Корпоративная сборка с DRM, мультикодек-лестницами, фолбэком на LL-HLS и готовностью к SOC 2 / HIPAA — 4–8 месяцев. Agent Engineering ощутимо ужимает оба конца этого диапазона.
В чём разница между SFU и MCU?
SFU пересылает поток каждого участника, не декодируя; CPU — низкий, масштабирование — до 500 участников на комнату. MCU декодирует все потоки, смешивает их в один и заново кодирует единственный выход: тяжёлый по CPU, но полезный, когда нижестоящий клиент способен принять только один поток (легаси-системы, SIP-шлюзы, запись). В 2026 году SFU — дефолт; MCU остаётся под ограничения.
Нужен ли мульти-DRM?
Для премиум-OTT — да: Widevine для Android / Chromium, FairPlay для Apple, PlayReady для Microsoft. Большинство управляемых сервисов берут на себя упаковку и ротацию ключей по всем трём. Для не премиум-лайва (вебинары, спорт без эксклюзивных прав) DRM обычно избыточен: TLS + подписанные URL и доступ по токену закрывают 95% сценариев.
Сколько стоит доставка лайв-события на 100 тыс. одновременных зрителей?
Порядок величины: 11–30 тыс. ₽ в час стриминга на глобальном CDN при 720p H.264 на 100 тыс. одновременных зрителей; HEVC обрезает ~30%, AV1 — примерно вдвое. Собственные кодирующие фермы меняют фиксированную часть. Ожидайте 1,5–3,7 млн ₽ инженерных инвестиций на отладку пайплайна перед первым событием и ещё 375 тыс.–1,1 млн ₽ операционных расходов на каждое событие такого масштаба.
Что почитать дальше
WebRTC
Гид по архитектуре WebRTC для бизнеса в 2026
P2P, SFU, MCU и гибрид — выбор топологии, который формирует задержку интерактива.
Инфраструктура
Edge-вычисления для лайв-стриминга
Где разместить кодеры и упаковщики, чтобы удержать p95-задержку.
AI и видео
Обработка видео в реальном времени с AI: гид 2026
Как инлайн-AI меняет лайв-стриминговый пайплайн и не ломает бюджет задержки.
OTT
Разработка OTT-платформы: исчерпывающий гид
Картина шире, когда продукт держится на HLS и DRM, а не на WebRTC.
Готовы запустить стриминг, который попадает в целевую задержку?
Низколатентный стриминг в 2026 году — это системная задача с поэтапным разбором. WebRTC для интерактива, LL-HLS для близкого к реальному времени бродкаста, классический HLS, когда задержка не критична. Кодек, CDN и настройка плеера влияют на стоимость сильнее, чем выбор протокола; p95-задержка — та метрика, которая удерживает клиентов, а не среднее значение.
Если вы проектируете лайв-стриминговый продукт, быстрее всего — 30-минутный разговор с командой, которая запускала WebRTC, LL-HLS и HLS на уровне Netflix, HBO и доказательного видео. Мы посмотрим на вашу аудиторию, целевую задержку и потолок по стоимости и подскажем, где разрабатывать, где брать готовое и где прячутся тихие пожиратели недель.
Поговорите с инженерами, которые запускают низколатентный стриминг
30 минут, без слайдов. Принесите текущий стек — разложим его на план с оценкой в неделях.
