Блог: разработка white label video SDK в 2026 году — полное руководство по внедрению

Главное

White label video SDK позволяет выпустить брендированный видеопродукт за недели, а не за кварталы. Вы полностью владеете интерфейсом, а вендор берёт на себя медиасерверы, кодеки, TURN, запись и глобальную маршрутизацию.

В 2026 году короткий список — шесть вендоров. Agora, LiveKit (managed или self-hosted), Daily, 100ms, Twilio Programmable Video и Amazon Chime SDK закрывают 90% реальных сценариев.

Стоимость на масштабе различается у вендоров в 10 раз. Цена за минуту варьируется от 74 ₽ за 1 тыс. минут (LiveKit Cloud, нижний тариф) до 300–600 ₽ за 1 тыс. минут (премиум-тарифы Agora и Dolby), а self-hosted LiveKit на Hetzner может обходиться дешевле 22 ₽ за 1 тыс. минут, если вы готовы взять эксплуатацию на себя.

Выбирайте по потолку возможностей, а не по полу. Запись, simulcast, AI-шумоподавление, on-device-транскрипция, end-to-end-шифрование, HIPAA BAA и data residency — именно здесь вендоры расходятся, и здесь же резко взлетают издержки на смену вендора, если вы ошиблись с выбором.

Фора Софт выпускает white-label MVP за 4–6 недель. Agent Engineering и более 18 лет работы с WebRTC и SDK сжимают то, на что у большинства команд уходит квартал. Реальные проекты: Sprii, BrainCert, ProVideoMeeting.

Зачем Фора Софт написала это руководство

Фора Софт занимается продуктами для видео и аудио в реальном времени с 2005 года. Наша команда выпустила более 200 проектов в e-learning, телемедицине, видеонаблюдении, видеоконференциях и live commerce, и значительная их часть работает на white label video SDK под полностью кастомным брендом и интерфейсом. Мы числимся в реестрах разработчиков-экспертов по Agora, LiveKit, Twilio и Wowza, а наша инженерная практика по WebRTC выпускала и интеграции с managed-SDK, и self-hosted SFU-деплои на масштабе.

Это руководство — версия разговора, который мы каждую неделю ведём с основателями, CTO и продуктовыми лидерами, набирающими в Google «white label video SDK». Мы расскажем, что на самом деле даёт этот термин в 2026 году, какие шесть вендоров заслуживают шорт-листа, во сколько каждый из них обойдётся при реальном трафике, что заложить в бюджет на части, которые вендор не покрывает (кастомный интерфейс, паритет на мобильных, хранение записей, observability), и где большинство команд сжигают шесть месяцев впустую.

На каждом новом проекте мы используем Agent Engineering — модель доставки, усиленную AI. Это сокращает типовые 10–14 недель на white-label MVP до 4–6 недель при том же объёме работ, и сэкономленное время напрямую сокращает срок выхода на рынок.

Нужно второе мнение по выбору видео-SDK?

За 30 минут разговора вы получите рекомендацию по вендору, опирающуюся на 18+ лет опыта работы с WebRTC — без презентаций и без привязки к нам.

Позвоните нам → Напишите нам →

Что такое white label video SDK на самом деле

White label video SDK — это SDK для видео и аудио в реальном времени, который вы встраиваете в свой продукт, выпускаете под своим брендом и показываете в своём интерфейсе: ни логотипа вендора на экране, ни надписи «powered by», ни общего входа, ни ко-брендированного водяного знака на записях. Под капотом вендор делает самое сложное: медиасерверы, TURN/STUN, согласование кодеков, simulcast, конвейеры записи, географическую маршрутизацию и протокольный клей, который удерживает WebRTC живым через файрволы и мобильные сети.

White label — это в основном про контракт и визуал. Большинство крупных вендоров — Agora, LiveKit, Daily, 100ms, Twilio, Amazon Chime SDK — по умолчанию не вшивают себя в ваш продукт; вы приносите свои UI-компоненты, владеете списком пользователей и контролируете метаданные сессии. У части вендоров (Whereby, Zoom Video SDK на старших тарифах) есть опциональные готовые UI-компоненты, от которых при желании можно отказаться.

White label против брендированного SaaS. Брендированный SaaS вроде Zoom или Webex показывает свой бренд на каждом экране и держит ваш тенант внутри своего домена. White label video SDK работает внутри вашего домена, вашего приложения, вашей аутентификации и вашей модели данных. Вы меняете готовый интерфейс вендора на полный контроль над дизайном.

White label против полностью кастомной WebRTC-сборки. Кастомная WebRTC-сборка — это когда вы поднимаете собственный SFU (обычно LiveKit, Janus, mediasoup или Jitsi), эксплуатируете свои TURN-серверы и владеете всем стеком. White label SDK прячет это за API. Компромисс тот же, что и в любой инфраструктуре: скорость сейчас против предельной стоимости и контроля потом.

Когда брать white label, а когда нет

Правильный ответ зависит от трёх чисел: сколько минут видео ваши пользователи будут генерировать в месяц на первом году, насколько уникальным должен быть видео-UX и сколько у вас инженерной мощности на инфраструктурную работу, которая не отличает продукт от конкурентов.

Берите white label SDK, когда: видео должно появиться в продукте за 8 недель, ожидаемый трафик первого года — менее 10 млн минут в месяц, в команде ноль или один WebRTC-специалист, а UX кастомный, но базовый сценарий звонка — конвенциональный (1:1, групповой, вебинар или live shopping).

Берите self-hosted (LiveKit, mediasoup, Janus), когда: вы выйдете за ~30 млн минут в месяц, нужен on-prem-деплой для регулируемого заказчика, требуется глубокий контроль над кодеком или медиасервером (кастомные SVC-слои, ML внутри пайплайна, обработка на стороне FFmpeg), либо экономика за минуту определяет вашу прибыль и убытки.

Берите брендированный SaaS (Zoom, Webex), когда: видеокомната — это и есть продукт, но ваше отличие — в окружающем рабочем процессе (CRM, планирование, аналитика), и вы готовы терпеть бренд вендора на экране. Для аудитории этой статьи такой случай редок.

Чек-лист обязательных функций

Прежде чем сравнивать вендоров, выпишите, какие из пунктов ниже вашему продукту действительно нужны в первые 12 месяцев. Большинство разочарований от white label SDK связаны с вендорами, которые на странице с фичами выглядят одинаково, но резко расходятся в этих деталях.

1. Топология маршрутизации. P2P (mesh) нормально работает примерно до четырёх участников. SFU (selective forwarding unit) — современный дефолт для 2–200 участников. MCU (server-side mixing) имеет смысл, только если вам нужен один скомпонованный поток на выходе для трансляции или записи на устройствах, которые не умеют декодировать множественные потоки. Все вендоры в нашем шорт-листе используют SFU; различия — в поддержке simulcast и SVC.

2. Simulcast и SVC. Simulcast позволяет SFU выбирать подходящее разрешение для каждого подписчика. SVC (scalable video coding) идёт дальше: разбивает один поток на временные и пространственные слои. Если ваша аудитория сидит на нестабильных мобильных каналах, нужны оба механизма. У Agora, LiveKit и 100ms — first-class simulcast; у Daily и Twilio — только simulcast.

3. Запись. Бывает двух видов: composite (вендор отдаёт один MP4 в указанной вами раскладке) и track (вендор выгружает сырые потоки каждого участника отдельно, а вы потом сами их компонуете). Composite проще, track дешевле на масштабе и открывает возможность AI-обработки по каждому говорящему. Цены на запись проверяйте отдельно от цены за минуту — у некоторых вендоров запись стоит в два раза дороже минут.

4. Вывод в live streaming. Если нужно отправлять звонок в RTMP, HLS или LL-HLS на YouTube-подобную аудиторию, SDK должен поддерживать Live Streaming или RTMP-push как managed-функцию. Agora и 100ms делают это нативно. С LiveKit — через Egress.

5. AI-функции. Современные стеки идут с AI-шумоподавлением (RNNoise, Krisp, проприетарное), виртуальными фонами, транскрипцией в реальном времени, диаризацией спикеров и распознаванием эмоций на устройстве. Покрытие неравномерное — об этом ниже в разделе про AI.

6. End-to-end-шифрование. Дефолтный для WebRTC DTLS-SRTP шифрует данные в транспорте, но на SFU они расшифровываются. Полноценный E2EE (insertable streams + ключи на стороне клиента) поддерживают Agora, LiveKit, Daily и 100ms; из коробки — нет у Twilio, Whereby и Chime SDK.

7. Паритет на мобильных. Все вендоры заявляют iOS, Android, web и React Native. Читайте их changelog: разрыв в фичах между web SDK и React Native SDK — то место, где большинство команд находит баги к шестой неделе.

Build vs buy vs fork: матрица компромиссов

Универсально правильного пути нет. Есть путь, который соответствует вашей стадии, команде и юнит-экономике. Матрица ниже — та, которой мы пользуемся на скоупинг-звонках.

Путь Срок до MVP Стоимость 1-го года Предельная стоимость / 1 тыс. мин Контроль Подходит для
Managed white label SDK 4–8 недель 2,2–9 млн ₽ 75–600 ₽ Средний MVP, mid-market SaaS
Self-hosted open source (LiveKit / mediasoup) 10–16 недель 6–16 млн ₽ 15–60 ₽ Высокий Стадия масштабирования, регулируемые отрасли
Полностью кастомный WebRTC + медиа-стек 6–12 месяцев 22–52 млн ₽ 7–37 ₽ Полный Телеком, видеонаблюдение, on-prem
Гибрид (SDK + кастомный edge) 8–14 недель 4,5–13 млн ₽ 37–225 ₽ Средне-высокий Live commerce, телемедицина

Стоимость первого года включает только инжиниринг по верхней границе и предполагает одного опытного WebRTC-контрактора на путях с SDK и self-hosted. С выделенной командой Фора Софт, использующей Agent Engineering, ожидайте нижнюю границу каждой строки.

Сравнительная матрица white label video SDK на 2026 год

Восемь вендоров выигрывают каждый шорт-лист, который мы готовим клиентам. Цены ниже взяты из публичных прайсов на момент публикации. На объёмах согласованные корпоративные тарифы стабильно ниже на 30–60%.

Вендор Хостинг Free tier Цена / 1 тыс. мин E2EE HIPAA BAA Подходит для
Agora Облако, 200+ ЦОД 10 тыс. мин 74–299 ₽ Да Да Азия, live commerce, social
LiveKit Cloud Облако или self-host 5 тыс. участник-минут 37–112 ₽ Да Да (Cloud) AI-агенты, контроль, масштаб
Daily Облако 10 тыс. мин 225–300 ₽ Да Да Быстрые прототипы, US-ориентированный SaaS
100ms Облако 10 тыс. мин 112–225 ₽ Да Да Вебинары, большие групповые звонки
Twilio Programmable Video Облако Нет 300–375 ₽ Нет (только DTLS) Да Телеком, регулируемый рынок США
Vonage Video API Облако 2 тыс. мин 296–450 ₽ Ограниченно Да Телемедицина, корпоративный сегмент ЕС
Amazon Chime SDK AWS Не фиксирован 63–112 ₽ Ограниченно Да Команды на базе AWS
Whereby Embedded Облако, ЕС-приоритет 2 тыс. мин 299–600 ₽ Да Да Готовый интерфейс, ЕС-резидентность

Как читать эту матрицу

Цена — ориентир, а не оффер. Каждый вендор публикует прайс и подписывает сделки на 30–60% ниже прайса, как только вы фиксируете объём. Цифры выше позволяют сравнивать порядки величин, а не реальные предложения.

«Подходит для» отражает наблюдаемые сильные стороны. У Agora — самое глубокое присутствие в Азиатско-Тихоокеанском регионе и самый широкий трек-рекорд в live commerce. LiveKit доминирует в разговорах про AI-агентов и self-host. Daily и 100ms борются за корону «самый простой API». Twilio и Vonage — естественный выбор по CPaaS, если вы уже используете их SMS или голос. Chime SDK — очевидный выбор, если вы уже платите за AWS.

Twilio Programmable Video жив. Twilio публично отменил запланированный end-of-life в 2024 году, и продукт по-прежнему поддерживается. Срочности уходить с Twilio в 2026-м больше нет, но продукт фиче-заморожен по сравнению с Agora и LiveKit. Если вы стартуете с нуля и у вашей команды нет истории отношений с Twilio, выбирайте LiveKit, Agora или 100ms.

Хотите шорт-лист вендоров под ваш конкретный сценарий?

Пришлите оценку трафика и список нужных функций. Мы вернёмся с одностраничной запиской: какие два вендора подходят, ожидаемый ежемесячный счёт и риски интеграции.

Позвоните нам → Напишите нам →

Эталонная архитектура: как собирается white-label видеопродукт

Даже если SDK прячет медиапуть, всю остальную систему вы проектируете сами. Описанная словами схема ниже — архитектура, которую мы используем на большинстве проектов Фора Софт.

Клиент (web, iOS, Android, Electron). Ваш интерфейс вызывает SDK, чтобы публиковать камеру и микрофон и подписываться на пиров. Ваш код, пакет SDK от вендора. Мы выпускаем кросс-платформенные интерфейсы на React, Swift, Kotlin, React Native и всё чаще — с общей бизнес-логикой на Kotlin Multiplatform.

Сервис аутентификации и комнат. Ваш бэкенд выписывает короткоживущие JWT, с которыми SDK заходит в комнату. Здесь вы проверяете права, биллинговые лимиты и тенантность. Двух эндпоинтов — POST /rooms и POST /tokens — хватает на 80% работы.

SFU и TURN-релей вендора. SDK открывает шифрованный медиапуть до ближайшего ЦОД вендора. Эту часть вы не эксплуатируете, но мониторите задержку, джиттер и потери пакетов через аналитический API вендора.

Recording / Egress. Когда сессия заканчивается, вендор по вебхуку выгружает composite- или per-track-запись в ваш бакет S3. Дальше — ваш конвейер: транскодинг, транскрипция, AI-анализ. Обычно мы используем AWS S3, Cloudflare R2 или объектное хранилище Hetzner в зависимости от стоимости.

Вывод в live streaming (опционально). Тот же конвейер записи, другой получатель: egress вендора отправляет RTMP в YouTube, Twitch, ваш собственный CDN или в Wowza для раздачи по HLS / LL-HLS.

Observability. Два слоя: дашборды на стороне вендора (Agora Analytics, LiveKit Insights, метрики Daily) и ваша продуктовая аналитика (Mixpanel, Amplitude, PostHog). Вендор расскажет про потери пакетов; ваша аналитика — досидел ли пользователь до конца звонка.

SFU vs MCU vs P2P в одном абзаце

P2P отправляет каждый поток каждому пиру; полоса масштабируется как N×(N-1) и умирает после четырёх участников. SFU получает каждый поток один раз и форвардит подписчикам индивидуально; полоса на сервере масштабируется как N×подписчиков, а нагрузка на декодер у клиентов остаётся низкой, потому что они декодируют каждый поток отдельно. MCU миксует всё на сервере в одну скомпонованную картинку; клиенты декодируют один поток, но сервер платит большую CPU-цену. White label SDK — SFU-first; некоторые поддерживают MCU как путь записи.

AI-функции: что уже работает, а что в roadmap

Каждый вендор в 2026 году продаёт «AI». Реальные возможности — и наблюдаемая задержка — сильно отличаются. Вот что работает сегодня и где придётся катать своё.

Шумоподавление. ML-денойзинг в стиле Krisp стал базовой нормой. Agora поставляет AI Voice Enhancement, у LiveKit Cloud встроена интеграция с Krisp, у 100ms — собственная модель, у Daily — Krisp. Качество отличается в пределах ~5%, дефолтные настройки редко требуют тюнинга.

Виртуальные фоны. Универсальная функция. Интересные различия — стоимость по CPU на слабых Android-устройствах, поддержка Web Worker и возможность подменить модель собственной (LiveKit разрешает, большинство — нет).

Транскрипция в реальном времени. Три паттерна: встроенная у вендора (LiveKit + Deepgram или AssemblyAI, 100ms + Symbl, Daily + Deepgram), bring-your-own (вы тянете аудиодорожку через Egress и стримите её в собственный ASR) или on-device (Apple Speech, Android SpeechRecognizer, Whisper-tiny). Для многоязычной транскрипции в реальном времени смотрите наши разборы по live-переводу в реальном времени для телеконференций и лучшему AI для распознавания речи.

AI-агенты внутри звонка. Agents-фреймворк от LiveKit, Conversational AI от ElevenLabs и Vapi/Retell поднимают планку для встраивания LLM-участников в звонок — для коучинга продавцов, репетиторства по языкам, телемедицинской триажной сортировки. На managed-стеке end-to-end-задержка (микрофон → STT → LLM → TTS → динамик) сегодня укладывается в 600–900 мс. Наш проект Meetric (AI-платформа для видеозвонков продавцов) использует именно этот паттерн, чтобы коучить менеджеров в реальном времени.

Анализ эмоций и тональности. Стандартом ни у одного SDK не является. Реализация — на вашей стороне: захватываете кадры или аудиочанки, прогоняете через инференс-сервис (Hume, наши собственные модели, кастомный OpenCV) и выводите оценки в интерфейс. Так мы делаем в Vocal Views для анализа звонков в маркетинговых исследованиях.

AI для аномалий и видеонаблюдения. Когда камера не имеет оператора (безопасность, телематика, ритейл), «AI» живёт в конвейере записи, а не в звонке. Архитектурный паттерн, который мы внедряем, описан в наших материалах по AI-обнаружению аномалий в видеонаблюдении.

Безопасность и комплаенс: HIPAA, GDPR, SOC 2, E2EE

Комплаенс — та область, где выбор SDK чаще всего вас фиксирует. Пройдитесь по этим четырём пунктам до подписания.

1. HIPAA Business Associate Agreement. Требуется, если вы обрабатываете защищённую медицинскую информацию в США. BAA подписывают Agora, Daily, 100ms, Twilio, Vonage, Whereby и Chime SDK; LiveKit Cloud — на старших тарифах. Проверьте охват BAA: некоторые покрывают только транзит, без хранения записей.

2. GDPR и data residency. Заказчики из ЕС ожидают маршрутизацию медиа внутри ЕС и хранение записей в ЕС. Daily, 100ms, Whereby и LiveKit Cloud предлагают маршрутизацию только в ЕС. У Agora зрелая конфигурация area-of-restriction; у Twilio есть регионы в Ирландии. Подтверждайте письменно — дефолтная маршрутизация редко ограничена ЕС.

3. SOC 2 Type II. Все крупные вендоры поддерживают отчёты SOC 2 Type II. Мелкие вендоры (Stream Video, отдельные нишевые игроки) пока на Type I или находятся в аудите. Просите отчёт под NDA до подписания.

4. End-to-end-шифрование. Дефолтный для WebRTC DTLS-SRTP шифрует канал клиент ↔ SFU. Полноценный E2EE (когда SFU видит только непрозрачные кадры) требует Insertable Streams / encoded transforms с ключами на стороне клиента и отключает большинство серверных функций (запись, транскрипция), если вы не делаете их на устройстве. Выбирайте битвы: многие регулируемые покупатели принимают «шифрование в транспорте и в покое» без полноценного E2EE.

Расчёт стоимости: сколько вы заплатите на трёх масштабах

Ниже — математика, которую мы прогоняем с основателями. Цифры на основе прайсов; считайте, что ваш согласованный тариф будет на 30–50% ниже на строках «Mid-market» и «Enterprise».

Допущения. 720p при 1,5 Мбит/с, средняя сессия 30 минут, по умолчанию двое участников. Записи хранятся 90 дней по 1,7 ₽ за ГБ-месяц на AWS S3 Standard или 0,37 ₽ за ГБ на Cloudflare R2.

Масштаб Минут / месяц Прайс Agora LiveKit Cloud Прайс 100ms Self-host (Hetzner)
Ранний MVP 100 тыс. ~7 500 ₽ ~3 700 ₽ ~11 200 ₽ ~24 000 ₽ (1 нода AX)
Mid-market 5 млн ~375 000 ₽ ~187 000 ₽ ~562 000 ₽ ~135 000 ₽ (3 ноды + ops)
Enterprise 50 млн ~3,7 млн ₽ (по согласованию) ~1,8 млн ₽ ~5,6 млн ₽ ~600 000 ₽ (мульти-регион)

Self-hosted LiveKit на серверах Hetzner серии AX дешевле на порядок при масштабе, но эксплуатационные ставки реальны: минимум один SRE на полставки на строке «Mid-market», один на полную ставку плюс дежурная ротация на строке «Enterprise». Точка пересечения, где self-host обыгрывает SDK по совокупной стоимости, обычно лежит в районе 8–15 млн минут в месяц.

Хранение записей — частая забытая статья. 30-минутная composite-запись в 720p весит ~270 МБ. На 100 тыс. минут в месяц это ~9 ТБ новых данных в месяц — около 15 000 ₽ в месяц на одном R2 и 150 000 ₽ и больше на S3 Standard при 90-дневном хранении.

Мини-кейс: запуск white-label видеостека за 12 недель

Ситуация. Стартапу в области live shopping — Sprii — потребовался полностью брендированный продукт для ведущих и зрителей с поддержкой ведущего и со-ведущего, чата зрителей, in-stream-витрин товаров, событий покупки в реальном времени, записи для VOD-повторов и аптайма 99,9% во время 90-минутных пиковых эфиров с тысячами одновременных зрителей. У них в команде было два senior-продуктовых инженера, ноль WebRTC-специалистов и четырёхмесячный дедлайн перед крупным ритейл-запуском.

План на 12 недель. Недели 1–2: воркшоп по выбору вендора, JTBD-интервью, выбор Agora за функции для live commerce и азиатские POP. Недели 3–5: бэкенд для комнат и токенов, роли ведущий / со-ведущий / зритель, синхронизация витрины товаров через сигналинг. Недели 6–8: web-интерфейс ведущего на React, интерфейс зрителя на Next.js, мобильное приложение зрителя на React Native. Недели 9–10: composite-запись → S3 → конвейер HLS VOD, аналитика в реальном времени. Недели 11–12: нагрузочное тестирование до 5 тыс. одновременных зрителей, харденинг, запуск.

Результат. Брендированный запуск в срок. В стабильном режиме — 99,95% успешных сессий, glass-to-glass-задержка ведущий-зритель меньше 400 мс на best-effort-сетях, задержка от записи до VOD меньше 90 секунд для нарезок. Мы также выпустили виртуальный класс BrainCert на том же паттерне SDK с многокамерными комнатами учителей, breakout-комнатами и записью HIPAA-уровня для школьных округов K-12.

Хотите похожий план на 12 недель, рассчитанный под ваш трафик и список функций? Позвоните или напишите нам — вы выйдете из разговора с рекомендацией по вендору и понедельным таймлайном.

Реалистичные сроки разработки

Ниже — фазовый план, который мы выпускаем. Календарные недели рассчитаны на команду Фора Софт с Agent Engineering. Умножайте на 1,5 для типичной in-house-команды без предыдущего опыта с WebRTC.

Фаза Недели Результат
Discovery + выбор вендора 1–2 Рекомендация по вендору, модель стоимости, реестр технических рисков
Скелет бэкенда 2–3 Аутентификация, комнаты, токены, вебхуки, S3-приёмник записей
Web-клиент 3–4 Лобби до звонка, экраны во время и после звонка, дизайн-система
Паритет на мобильных 2–4 iOS, Android (или React Native), тесты на паритет функций
Запись + транскрипты 1–2 Composite или per-track, транскрипты, поисковый индекс
Нагрузочное и chaos-тестирование 1 Синтетическая пиковая нагрузка, искажения сети, отказоустойчивость
Запуск + observability 1 Дашборды, алертинг, плейбук инцидентов, runbook

Как выбрать white label video SDK: пять вопросов

1. Каков ваш месячный бюджет минут на первом и третьем году? Меньше 5 млн в месяц на первом году — берите самое простое облачное SDK. Больше 30 млн в течение 24 месяцев — закладывайте миграцию на self-host с первого дня (используйте LiveKit Cloud и планируйте перевести его к себе).

2. Где живут ваши пользователи? Тяжёлый трафик из Азии — за Agora с её плотностью POP. Только ЕС — Daily, 100ms или Whereby за простоту резидентности. AWS-нативный трафик из США — Chime SDK по стоимости.

3. Как выглядит звонок? 1:1 в телемедицине: любой вендор. Совместная работа на 10 человек: любой вендор. Live shopping с 5 тыс. зрителей и больше: Agora, 100ms или LiveKit. AI-агент в звонке: LiveKit, рядом — Daily и Vonage. Вебинар на 10 тыс. участников: 100ms или LiveKit Cloud Egress.

4. Какой комплаенс нужен с первого дня? HIPAA: подтвердите охват BAA. Резидентность ЕС: подтвердите привязку к региону. E2EE: выбирайте между Agora, LiveKit, Daily и 100ms.

5. Насколько экзотичен ваш UX? Если нужна кастомная сетка видео, side-by-side-оверлеи, динамическая компоновка камер или продуктовые карточки внутри стрима, выбирайте SDK, отдающие сырые track-API: Agora, LiveKit, 100ms, Daily. Если нужно вкорячить готовый интерфейс — Whereby Embedded.

Пять типичных ошибок, которые мы видим каждый квартал

1. Выбор только по цене за минуту. За дешёвыми минутами прячутся дорогая запись, дорогой AI, дорогая транскрипция, дорогая поддержка. До подписания соберите P&L из шести строк со всеми статьями.

2. Пропуск теста на сетевые искажения. Wi-Fi в офисе — это не 4G в метро Мумбая. Используйте Network Link Conditioner, atc или TURN-only-путь с потерями пакетов; если ваш звонок умирает при 5% потерь, у пользователей он тоже умрёт.

3. Конвейер записи строится последним. Запись — источник истины для комплаенса, AI, тикетов поддержки и продуктовой аналитики. Стройте её на третьей неделе, а не на десятой.

4. Допущение, что мобильный паритет подождёт. 60% потребительского трафика — мобильный. Обработка фоновых режимов на iOS, батарея на Android и баги моста React Native — это 2–3 спринта работы, которую документация SDK преуменьшает. Закладывайте время.

5. Нет плана выхода от вендора. Даже у отличного вендора будущая поломка масштаба или изменение цен может вынудить переезжать. Инкапсулируйте вызовы вендора за тонким внутренним API с первого дня. Смена SDK без такой абстракции — переписывание на 4–8 недель; с ней — 1–2 недели.

KPI, которые надо отслеживать с первой недели

KPI качества. Glass-to-glass-задержка <400 мс в одном регионе, <700 мс между регионами. Средние потери пакетов <1,5%. Аудио MOS >4,0. Доля заморозок видео <0,5% от минут сессии. Снимайте эти метрики по сессии через аналитический API вендора и сшивайте с собственными ID пользователей.

Бизнес-KPI. Доля завершённых сессий >90%. Время до первого кадра <2 с при холодном входе. NPS после звонка >40. Активные минуты на платящего клиента в месяц — опережающий индикатор расширения выручки. Время до первого видео для нового тенанта — современная планка ниже 60 секунд.

KPI надёжности. P99 времени входа <5 с. Часы инцидентов на стороне вендора <0,5 в месяц. Доля успешных записей >99,5%. MTTA по инциденту <15 минут, MTTR <90 минут. Если вендор не готов делиться собственными данными по надёжности по запросу, это уже сигнал.

Когда white label — неправильный ответ

White label SDK — правильный выбор в большинстве случаев. Неправильный — когда верно одно из: ваш продукт и есть звонок (конкурент Zoom, конкурент Teams), и экономика за минуту вас съест на масштабе; нужен on-prem-деплой для регулируемого заказчика, который не примет публично-облачный SFU (оборона, закрытые суды, отдельные системы здравоохранения); медиапайплайн обязан выполнять серверный ML внутри hot path звонка (покадровая редакция, анализ медицинских изображений в реальном времени); в команде — два или больше senior WebRTC-инженеров, которые иначе будут недозагружены.

Наш проект Nucleus — on-premise-платформа коммуникаций — пример: заказчик требовал полного развёртывания на месте, mediasoup в качестве SFU и нулевого исходящего трафика в стабильном режиме. White label был структурно невозможен.

Миграция между вендорами без переписывания кода

Большинство вендорских миграций, которые мы ведём, занимают 2–6 недель. Хитрость — в той самой абстракции, о которой мы говорили в разделе про ошибки: каждый вызов вендора прячется за тонким внутренним интерфейсом (JoinRoom, PublishTrack, SubscribeTrack, StartRecording, EmitEvent). Большинство команд этого не делают и при миграции платят дважды.

Типовые миграции 2026 года. Twilio → LiveKit Cloud (по стоимости и продуктовой дорожной карте). Daily → Agora (по производительности в Азии). Agora → LiveKit self-hosted (по экономике за минуту на масштабе). Vonage → 100ms (по более простым вебинарам). Механика похожая: меняем SDK, перевыпускаем токены, переподписываем вебхук записи, повторно прогоняем тест на сетевые искажения, потом неделю пишем трафик параллельно, чтобы убедиться в паритете.

Если вы читаете это, потому что недовольны текущим вендором, наш подход к скоупингу миграции описан в материалах по кастомной разработке на Agora и в плейбуке про то, когда нанимать WebRTC-команду.

Уходите с видео-SDK, который перестал подходить?

В 2025–2026 годах мы провели десяток вендорских миграций. Расскажите про текущий стек — мы пришлём одностраничный план миграции в течение 48 часов.

Позвоните нам → Напишите нам →

FAQ

«White label» — это то же самое, что «кастомно брендированный»?

Да — на этом рынке термины взаимозаменяемы. Оба означают, что бренд вендора скрыт, а заказчик выпускает продукт как свой. Важна контрактная формулировка: подтвердите письменно, что в пользовательских поверхностях, включая записи, не появляются логотипы, водяные знаки, надписи «powered by» и ко-брендированные URL вендора.

Привяжет ли меня к одному вендору?

Только если вы дадите вендорскому SDK протечь во все слои кода. Постройте поверх SDK тонкую внутреннюю абстракцию — и миграция превратится в 2–6 недель замены вместо квартального переписывания. Мы делаем это на каждом проекте Фора Софт.

Сколько занимает интеграция white label SDK?

Типовой white-label MVP у Фора Софт — 4–6 недель, полная продакшн-версия — 10–14 недель. In-house-команды без опыта с WebRTC обычно тратят в 1,5 раза больше. Главные переменные — мобильные платформы в скоупе, нужные функции записи и насколько кастомен ваш видеоинтерфейс.

Twilio Programmable Video правда закрывают?

Нет. Twilio изначально объявил end-of-life на декабрь 2024-го, потом перенёс на 2026 год и в итоге полностью отменил отключение. Продукт по-прежнему поддерживается. При этом его дорожная карта явно медленнее, чем у Agora и LiveKit, поэтому новые проекты редко выбирают его по умолчанию.

Можно ли запустить white label SDK полностью on-prem?

Облачные managed-SDK (Agora, Daily, 100ms, Whereby) по определению работают на инфраструктуре вендора. Если on-prem — обязательное требование (оборона, закрытые проекты, отдельные системы здравоохранения), вам нужны self-hosted LiveKit, mediasoup или Janus. Оба варианта остаются «white label» в смысле бренда.

Поддерживают ли white label SDK end-to-end-шифрование?

DTLS-SRTP — универсальный механизм; он шифрует каждый участок между клиентом и SFU. Полноценный E2EE — когда SFU вообще не видит расшифрованных кадров — требует Insertable Streams + ключей на стороне клиента; это поддерживают Agora, LiveKit, Daily и 100ms. При полноценном E2EE серверная запись и транскрипция обычно отключаются, если только вы не делаете их на устройстве.

Как оценить месячный объём минут до запуска?

Используйте формулу: месячные активные пользователи × звонков на пользователя в месяц × минут на звонок × участников в звонке. Множитель по участникам важен: звонок на 4 человек по большинству моделей биллит 4 участник-минуты на каждую минуту. Стресс-тестируйте модель на двукратный консервативный рост.

Сколько стоит Фора Софт по сравнению с in-house-командой?

Стандартный white-label MVP у Фора Софт — 4–6 недель сфокусированного инжиниринга. Обычно мы быстрее и дешевле in-house-сборки для первого продукта, особенно с Agent Engineering, который сжимает менее трудоёмкие части. Точную оценку мы пришлём после звонка — без шаблонных диапазонов.

Основы

Что такое WebRTC: лучшее объяснение для нетехнических читателей

Протокол под каждым white label SDK — простыми словами.

Инфраструктура

AWS vs DigitalOcean vs Hetzner

Если решите когда-то держать SFU у себя — это та математика по стоимости, которая вам нужна.

Готовы выпустить white label видеопродукт в этом квартале?

White label video SDK — самый быстрый способ положить брендированный видеопродукт внутрь вашего приложения, не нанимая WebRTC-команду. Выбирайте по потолку возможностей, а не по полу. Выбирайте по экономике третьего года, а не по щедрости free tier. Выбирайте по HIPAA / GDPR / E2EE, если работаете в регулируемых отраслях. И заворачивайте всё, что выбрали, за тонкой внутренней абстракцией, чтобы потом сменить вендора, когда того потребуют экономика или функциональные изменения.

Фора Софт с 2005 года выпускает white label видеопродукты на Agora, LiveKit, Twilio и Wowza, а также на self-hosted mediasoup и Janus. С Agent Engineering мы можем заскоупить, спроектировать и выпустить брендированный MVP за 4–6 недель — быстрее и дешевле, чем сопоставимая команда контракторов на том же объёме. Если в этом квартале вы взвешиваете build vs buy, давайте посчитаем цифры вместе.

Давайте обсудим вашу white label видеосборку

За 30 минут разговора вы получите выбор вендора, таймлайн доставки и честную оценку. Без презентаций, без обязательств, без апсейла.

Позвоните нам → Напишите нам →

  • Технологии
    Услуги
    Разработка