Видеочат: фреймворк выбора — собрать или купить, и сравнение технических архитектур

Вам не нужно выбирать между «купить SDK от Zoom» и «собрать всё самостоятельно». В 2026 году видеочат — это спектр: четыре разных пути, и у каждого есть чёткая точка перелома, где следующий путь начинает окупаться. В этом материале — ответ за 90 секунд, фреймворк принятия решения и юнит-экономика, которая подкрепляет выбор.

В Фора Софт мы выпустили более 40 видеопродуктов — на Agora, Twilio, LiveKit, mediasoup и на чистом WebRTC. Каждые пару кварталов кто-то из основателей задаёт один и тот же вопрос, только в новой формулировке: «Купить white-label-платформу, взять SDK или собрать своё?». Универсального ответа нет. Зато есть фреймворк, который делает выбор очевидным за 20 минут.

Главное

  • Покупайте white-label (Whereby, Sendbird, Daily Prebuilt), если видео — это смежная функция продукта, нужно выпустить релиз за 4–8 недель, а одновременных комнат меньше ~50 на сессию.
  • Берите SDK (LiveKit Cloud, Agora, Zoom SDK), если видео — ядро продукта, но кодек не является вашим конкурентным преимуществом: UX за вами, медиаинфраструктура за вендором.
  • Поднимайте open source у себя (LiveKit, mediasoup), только если у вас более ~2 млн участнико-минут в год и хотя бы 3 инженера на full-time; ниже этой границы управляемое решение дешевле, как только вы заложите налог на дежурства.
  • Полностью кастомный WebRTC почти никогда не является ответом в 2026: узкие исключения — медицинские устройства под регулированием FDA, изолированные госсистемы или собственные кодеки.
  • Главный дифференциатор 2026 — это AI, а не задержка. Перевод в реальном времени, агенты для совещаний и живые аватары теперь отделяют лидеров от закостеневших старожилов.

TL;DR — ответ за 90 секунд

Сопоставьте свою ситуацию с одной из этих четырёх формулировок и закройте статью:

  • Видео — это функция, а не продукт. Вам нужно видео один-на-один или для маленьких групп внутри существующего приложения, релиз через 6 недель, а HIPAA или GDPR уже в требованиях. → Покупайте white-label. Whereby Embedded или Sendbird. К вторнику всё готово.
  • Видео — ядро, но не конкурентное преимущество. Нужны кастомный UX, аналитика, ваш бренд, возможно — AI-агенты в звонке, но запускать медиасерверы вы не хотите. → Берите SDK. LiveKit Cloud — самый безопасный выбор по умолчанию в 2026; Agora — если нужен масштаб в Азиатско-Тихоокеанском регионе; Zoom SDK — если ваш корпоративный заказчик уже живёт в экосистеме Zoom.
  • Видео — это сам продукт, и вы перерастёте управляемые тарифы. У вас 3+ инженера, более 2 млн участнико-минут в год, и нужно то, чего управляемые платформы не дают (E2EE с записью, собственные кодеки, полная локализация данных). → Поднимайте у себя LiveKit или mediasoup.
  • Вы в зарегулированной, изолированной или железо-зависимой нише. FDA, оборонка, вещание, медицинская визуализация в реальном времени. → Кастомный WebRTC. И даже в этом случае начинайте с LiveKit и форкайте только то, что действительно нужно.

Остальная часть статьи объясняет, почему — с ценами на 2026 год, фреймворком решения, пятью отраслевыми плейбуками и восемью ошибками, которые основатели повторяют из года в год.

Четыре пути в 2026 году

«Build vs buy» — ложная дихотомия. В 2026 есть четыре разных пути с очень разной структурой владения, операционной нагрузкой и точками окупаемости:

Путь Что получаете Что в вашей зоне Срок до релиза
1. White-labelГотовый UI комнаты в iframe или SDK. Whereby, Jitsi-as-a-Service, Sendbird, Daily Prebuilt.Создание комнат, контроль доступа, вебхуки.От дней до 2 недель
2. SDKПримитивы (комнаты, треки, участники). LiveKit Cloud, Agora, Daily, 100ms, Zoom SDK.UX, логика сигнализации, аналитика, бренд, интеграции.4–12 недель
3. Self-hosted open sourceПолный код SFU. LiveKit OSS, mediasoup, Janus, Pion.Всё вышеперечисленное плюс медиасерверы, масштабирование, кодеки, патчи безопасности.10–20 недель
4. Кастомный WebRTCЧистые браузерные и мобильные API WebRTC.Буквально всё — протокол сигнализации, обход NAT, лестница кодеков, контроль перегрузки.6–18 месяцев

Рис. 1. Четыре пути по возрастанию контроля и операционной нагрузки.

У каждого пути есть естественная точка перелома, где следующий начинает окупаться. И эти точки определяются не выручкой, а одновременной нагрузкой, требованиями к функциям и потолком соответствия требованиям. Большинство продуктов всю жизнь живут на путях 1 или 2; меньшинство переходит на путь 3. Путь 4 встречается реже, чем думают основатели.

Восемь вопросов, которые принимают решение за вас

Пройдите эти восемь вопросов по порядку. Первый «да», который существенно меняет ответ, и определяет путь. Большинство команд получают чёткую рекомендацию уже к четвёртому вопросу.

# Вопрос Если да →
1Видео — это функция внутри существующего продукта, а не сам продукт?White-label
2Нужен готовый UI с фирменной стилистикой, без собственной раскладки?White-label
3Нужны кастомный UX, аналитика, AI-агенты в звонке или нестандартная раскладка?SDK
4Видео — ядро конкурентного преимущества (вы продаёте качество, функции или низкую задержку)?SDK или self-host
5Преодолеете ли вы ~2 млн участнико-минут в год при высокой чувствительности к марже?Self-host
6Нужны одновременно E2EE и серверная запись или собственные кодеки?Self-host или кастом
7Есть ли у вас 3+ сильных инженера и готовность держать ~1 человека на постоянной поддержке?Self-host возможен
8Регулируетесь ли вы FDA, работаете в изолированной сети или интегрируетесь с железом (УЗИ, эндоскоп, вещание)?Кастомный WebRTC

Рис. 2. Идите по порядку. Останавливайтесь на первом существенном «да».

Примерно 60% команд, которым мы помогаем, останавливаются на пути 1 или 2 после четвёртого вопроса. Около 30% доходят до пути 3 на пятом или шестом. Меньше 10% действительно нуждаются в пути 4.

Что изменилось в видеочате между 2024 и 2026 годом

Если ваш последний анализ build vs buy старше полутора лет, выбросьте его. Рынок сдвинулся по трём осям:

1. Twilio Video отменил закрытие, а потом отменил отмену. В 2023 Twilio объявил EOL. В октябре 2024 развернулся обратно. В 2025 продукт ушёл в режим «переход на Zoom Video SDK». К концу 2026 большинство новых проектов, которые ещё недавно выбрали бы Twilio, выбирают LiveKit или Zoom SDK. Урок для продуктовых руководителей: дорожные карты вендоров меняются — выбирайте платформы, чья open source-история позволяет уйти красиво.

2. LiveKit стал платформой по умолчанию «начнём отсюда». Два года назад это был достойный альтернативный вариант. В 2026 это первая рекомендация для большинства новых проектов потому что: (а) тариф Cloud конкурентоспособен по цене, (б) self-hosting — реальный запасной вариант, на который можно перейти, и (в) фреймворк Agents позволяет AI с голосом и компьютерным зрением заходить в комнаты как полноценные участники.

3. White-label-платформы наконец закрыли разрыв по соответствию требованиям. Whereby Embedded, Doxy.me, Sendbird и Daily теперь поставляют предварительно подписанные BAA, локализацию данных в ЕС и отчёты SOC 2 Type II «из коробки». Решение 2023 года «соберём своё, потому что white-label не закрывает HIPAA» в 2026 часто оказывается ошибочным.

4. AI — новая основа конкурентного преимущества. Перевод в реальном времени, живые субтитры, суммаризация совещаний и агенты-аватары (Tavus, HeyGen) теперь и есть точка отстройки. Качество видео стало товаром, а интеграция с AI — нет. Это толкает команды к платформам с открытыми фреймворками агентов (LiveKit) и от закрытых стеков, где AI идёт как премиальная надстройка.

Реальность рынка 2026: SDK с самой низкой ценой за минуту редко даёт самую низкую полную стоимость стека. Платформа, которая позволяет добавить AI, запись и перевод без смены вендора, выигрывает по TCO на горизонте 3 лет. Поэтому LiveKit Cloud — наша рекомендация по умолчанию, даже когда у Agora в прайс-листе ниже цифра за минуту.

Ориентир по ценам в 2026

Ниже — публичные или широко наблюдаемые ставки 2026 года по основным вариантам. Корпоративные контракты различаются, а составные функции (запись, транскрибация, дозвон) добавляют множители. Правило большого пальца: умножайте любую заголовочную ставку на 1,4–1,8, чтобы получить полную стоимость.

Вендор Путь Ставка 2026 Комментарии
Whereby EmbeddedWhite-label5 925 ₽/мес + ~0,30 ₽/мин сверхуHIPAA, GDPR из коробки; iframe или SDK
Sendbird CallsWhite-labelот 29 925 ₽/мес базово + потреблениеСвязка чата и звонков; mobile-first
Daily PrebuiltWhite-label и SDK~0,30 ₽/мин в группах13 мс на первом прыжке; встраиваемые комнаты или чистый SDK
AgoraSDK~74–299 ₽ за 1 тыс. мин.Тарифы SD/HD/Full HD; 10 тыс. бесплатных минут в месяц
LiveKit CloudSDKShip: 3 750 ₽/мес + 0,03 ₽ за минуту соединенияScale 37 500 ₽/мес; self-host open source бесплатно
100msSDK~0,22–0,37 ₽/минHIPAA, GDPR, SOC 2 Type II
Zoom Video SDKSDK~0,26 ₽/мин + 0,30 ₽ за запись30 тыс. бесплатных минут в месяц на годовых планах; удобен для корпоративного сегмента
VideoSDK.liveSDK~0,11 ₽/мин в HDКонкурентная цена; экосистема меньше
Twilio VideoSDK (закрытие)~0,11 ₽/мин P2P, 0,26 ₽/мин в группахПереход на Zoom; новые проекты не начинайте
LiveKit / mediasoup self-hostedOpen source~0,03–0,11 ₽/мин на инфраструктуруПлюс ~1 человек на DevOps + исходящий трафик; точка окупаемости ~2 млн мин/год

Рис. 3. Указаны публичные ставки, где они есть; корпоративные и объёмные скидки существенны. Перепроверяйте перед бюджетированием.

Когда покупать white-label (Whereby, Sendbird, Daily Prebuilt)

White-label означает, что вы встраиваете готовый UI комнаты (iframe или SDK) и настраиваете его — вы не проектируете видеоповерхность, а оформляете её под себя. Это правильный путь, когда видео смежно по отношению к вашему продукту.

Покупайте white-label, когда:

  • Видео — функция большего продукта: консультационные комнаты в CRM, занятия в LMS, звонки покупателя и продавца в маркетплейсе, собеседования в HR.
  • Нужно соответствие HIPAA или GDPR из коробки, без многонедельной юридической проверки. Whereby, Doxy.me и Sendbird поставляют BAA с уже подписанной стороны; большинство SDK требуют согласования BAA отдельно для каждого клиента.
  • Time-to-market меньше 8 недель, а в команде меньше трёх fullstack-инженеров, доступных под задачи с видео.
  • Одновременных участников в комнате до 50, и вы не делаете вещательных мероприятий.
  • Вы принимаете UX вендора, его примитивы раскладки и политику хранения записей без необходимости их расширять.

Где white-label ломается:

  • Потолок одновременности. Большинство white-label-комнат ограничены 25–50 участниками. Если в дорожной карте вебинары, общие собрания или виртуальные мероприятия — планируйте миграцию.
  • Жёсткость UX. Кастомные сетки, «картинка-в-картинке плюс доска», композиции «спикер + панель реакций + опрос внутри» — обычно невозможны без перехода на SDK.
  • AI-агенты. У Whereby/Sendbird нет нативных хуков, чтобы AI-агент заходил в звонок как участник. Постзвонковую транскрибацию прицепить можно, а живой AI в звонке требует SDK (LiveKit Agents).
  • Хранение и срок жизни записей. White-label-платформы обычно навязывают своё окно ретенции (часто 30 дней). Если юристам нужны записи 7 лет или вы хотите хранить их у себя в S3 — берите SDK.
  • Ценовые обрывы по MAU. Связки «чат + звонки» (Sendbird, Stream) тарифицируются по активным пользователям; на 500 тыс. MAU вам выкатят корпоративный прайс, который часто дороже самостоятельно поднятого SDK-стека.

Типичный успешный сценарий с white-label: маркетплейс или EdTech-продукт выпускает Whereby за шесть недель, проверяет функцию на реальных пользователях, а на втором году переезжает на SDK, когда объём и требования к UX перерастают iframe. Это не провальное решение, а правильная поэтапная раскатка. Не переинжинирьте на старте.

Когда брать SDK (Agora, LiveKit Cloud, Zoom SDK)

SDK даёт вам примитивы (комнаты, треки, участники, паблишеры), а UX вы собираете сами. Вендор отвечает за медиасерверы, обход NAT, географическую маршрутизацию, согласование кодеков и аптайм. Вы отвечаете за всё, что выше этой линии.

Берите SDK, когда:

  • Видео — ядро продукта: нужен свой UX, своя аналитика, свой бренд в видеоповерхности.
  • В звонок должны заходить AI-агенты (живой перевод, ведение заметок, модерация). LiveKit Agents — эталонный фреймворк для этого в 2026.
  • Нужна задержка ниже 200 мс с глобальным покрытием или ниже 100 мс — для совместной работы в реальном времени, телетерапии или сценариев, близких к играм.
  • У вас 2–5 сильных инженеров, которые потянут видеофункцию до релиза и первые 18 месяцев итераций.
  • Вы хотите контролировать, куда складываются записи (свой S3, своя политика хранения) и как транскрибация подключается к продукту.

Какой SDK в 2026 году:

SDK Когда выбирать На что обратить внимание
LiveKit CloudВыбор по умолчанию. AI-агенты, запасной выход через open source, понятная тарифная сетка.Меньшая сеть точек присутствия в APAC, чем у Agora.
AgoraГлобальный масштаб, APAC-аудитория, самая низкая задержка через SD-RTN.Сложный прайс, устаревшие UI-киты, привязка к вендору.
DailyСамая быстрая интеграция для встроенных конференций, простейший API.Экосистема меньше; AI-агенты менее зрелые.
Zoom Video SDKКорпоративный заказчик уже живёт в Zoom; вертикали здравоохранения и юриспруденции.Корпоративный прайс-лист; Zoom-брендированные примитивы просвечивают.
100msИндийский рынок, HIPAA/SOC 2 из коробки, хороший готовый UI.Глобальная сеть меньше; сообщество меньше, чем у LiveKit.
VideoSDK.liveАгрессивный прайс, развивающиеся рынки.SLA скромнее, сообщество ещё зреет.

Рис. 4. Матрица выбора SDK на 2026 год.

Наш внутренний выбор по умолчанию для нового проекта 2026 года — LiveKit Cloud, именно потому, что фреймворк Agents и путь self-host через open source оставляют открытыми две двери. Agora — наш выбор, когда пользователи сконцентрированы в Азиатско-Тихоокеанском регионе или нужна задержка меньше 100 мс на огромном масштабе. Zoom SDK выигрывает, когда корпоративный заказчик уже стандартизирован на Zoom и настаивает на знакомых UX-примитивах.

Не уверены, какой путь подходит вашему продукту?

Пришлите географию пользователей, пиковую одновременность и требования по соответствию — за 30 минут разложим их на Buy / SDK / OSS / Custom.

Позвоните нам → Напишите нам →

Когда строить на open source (LiveKit self-hosted, mediasoup)

Self-hosting на open source даёт вам полный медиастек — всё, что выше кодека. Это правильный путь, когда одновременно верны три вещи: (а) объём оправдывает инвестиции в инфраструктуру, (б) нужна функция, которой нет у управляемых SDK, и (в) у вас есть инженерная скамейка, чтобы это поддерживать.

Три варианта open source:

Платформа Язык Кому подходит Операционная нагрузка
LiveKit OSSGoКоманды, уже работающие в Cloud; дружелюбно к Kubernetes; AI Agents из коробки.Средняя (~0,5 человека)
mediasoupC++ / Node.jsКоманды, которым нужна производительность и собственная логика записи и симулкаста.Высокая (~1 человек)
JanusCСпециальные плагины (например, передача медицинской визуализации), исследования, WebRTC-шлюзы.Высокая (~1 человек)

Рис. 5. Операционная нагрузка — это реальные инженерные затраты, а не только стоимость серверов.

Правило большого пальца, выверенное нами на десятке self-hosted-развёртываний: self-hosting дешевле, чем LiveKit Cloud или Agora, примерно с 2 млн участнико-минут в год и выше — при условии, что вы заложите инженера на DevOps в режиме full-time. Ниже этой границы выигрывает управляемое решение по полной стоимости. Основатели систематически недооценивают этот «налог»: вы платите не только за инстансы EC2, но и за человека, который сможет разобрать рассинхрон SRTP в два часа ночи.

Если вы рассматриваете self-hosting, правильная последовательность обычно такая: запуститесь на LiveKit Cloud, докажите объём, а потом переезжайте на LiveKit OSS, когда операционная нагрузка станет оправданной. Код тот же самый, так что миграция — это в основном развёртывание инфраструктуры, а не смена платформы. Наша статья о плейбуке миграции разбирает этот путь подробно.

Когда собирать полностью кастомное решение на WebRTC

Полный кастом — это чистые браузерные и мобильные API WebRTC, свой протокол сигнализации, свои TURN/STUN, свой медиасервер, своя лестница кодеков. Правильный путь меньше чем в 10% разговоров «нам ли это строить?», которые мы ведём.

Узкие законные сценарии:

  • Медицинская визуализация под регулированием FDA. УЗИ через WebRTC с управлением битрейтом, аудит-уровневым логированием, кодированием под конкретное устройство. Готовые SFU не дотягивают до требований FDA Class II.
  • Изолированные госструктуры и оборонка. Никакого исходящего интернета, никакого стороннего облака, никаких непроверенных зависимостей.
  • Интеграция вещательного уровня. Связка в реальном времени с железом SDI, vMix или собственными продакшен-конвейерами, где нужна миллисекундная синхронизация.
  • Собственные кодеки. Сертифицированные FDA аудиокодеки для слуховых аппаратов, проприетарные видеокодеки для спутниковых каналов с узкой полосой пропускания.
  • Исследовательские и академические проекты. Где WebRTC-стек сам по себе и есть смысл работы.

Во всех остальных случаях старт с чистого WebRTC означает 12–18 месяцев переизобретения того, что уже сделали LiveKit или mediasoup: ICE/TURN, симулкаст, оценка пропускной способности, маршрутизация SFU, контроль перегрузки. Вы тратите инженерные циклы на инфраструктуру, которую пользователи не видят, вместо UX и AI-функций, которые реально отстраивают продукт.

Наш постоянный совет: если вы пришли к «нужно делать кастом», сначала убедитесь, что LiveKit self-hosted плюс узкий форк нужных компонентов не подойдёт. В 90% случаев он подойдёт.

Восемь продуктовых функций, которые меняют чашу весов

Некоторые функции принудительно задают архитектурный выбор. Если хоть одна из этих в вашей дорожной карте — закладывайте её сейчас, а не после того, как зафиксировали платформу.

1. Запись и E2EE одновременно. Архитектурно нерешённая задача в 2026. End-to-end-шифрование означает, что сервер видит только непрозрачные медиа и не может их компоновать или записывать. Вы выбираете одно. Большинство корпоративных клиентов выбирают прозрачную запись с соответствием на основе BAA, а не E2EE. Если обязательны оба — это территория полностью кастомного решения или очень узкого гибридного паттерна (запись на клиенте).

2. Breakout-комнаты с перехватом модератора. Нативно — у Whereby, Zoom SDK и Sendbird. В Agora/LiveKit требует своего UX и сигнализации, хотя у LiveKit неплохие примитивы миграции между комнатами.

3. Перевод в реальном времени. LiveKit Agents плюс низколатентный стек STT/LLM/TTS сейчас укладывается в менее чем 1 секунду перевода. В Agora нужна сторонняя интеграция. У Whereby/Sendbird нативной поддержки нет. Если перевод в дорожной карте — склоняйтесь к LiveKit.

4. AI-заметки и сводки встреч. Базовая планка для B2B в 2026. LiveKit поставляет это нативно через Agents. Agora и Zoom SDK требуют собственной оркестрации. У Whereby есть постзвонковый API-хук.

5. AI-участники с аватарами. Tavus и HeyGen Interactive Avatar работают на пайплайнах, совместимых с LiveKit. Кастомная реализация на других SDK — это ~6 недель интеграционной работы.

6. Скриншаринг с разметкой. Whereby и Zoom SDK дают это из коробки. В LiveKit/Agora слой разметки придётся строить самим.

7. Кастомные раскладки (спикер + сетка + опросы + чат). Возможны только в SDK или self-hosted. White-label-платформы зажимают вас в свою композицию.

8. Локализация данных (ЕС, Индия, Ближний Восток). У LiveKit Cloud, Agora и Zoom SDK в 2026 есть региональные опции. У Whereby нативные точки присутствия в ЕС. Полная локализация данных (в вашем собственном облачном аккаунте) требует self-hosting.

AI-нативный видеочат: что нового в 2026 году

Главный сдвиг в видеочате с 2024 года в том, что AI-агенты теперь заходят в звонки как полноценные участники. В 2026 значимы пять возможностей:

1. Перевод в реальном времени. Агент LiveKit, использующий Deepgram Nova-3 для STT, Claude Haiku 4.5 в качестве LLM и ElevenLabs Flash v2.5 для TTS, укладывается в ~700–900 мс задержки перевода end-to-end. Это уже разговорный темп. Наш плейбук по голосовому AI разбирает пайплайн в деталях.

2. Суммаризация и пункты действий. Агент транскрибирует звонок, прогоняет суммаризацию (после звонка или стримом) и отдаёт структурированные пункты действий в вашу CRM. Это паттерн Otter/Fireflies, теперь встраиваемый в любой продукт на LiveKit.

3. AI-интервьюеры и продавцы. Голосовой AI-агент, проводящий discovery-звонки, пред-скрининг кандидатов или квалификацию лидов. Требует низкой задержки speech-to-speech и хорошего определения окончания реплики. Эталонный фреймворк — LiveKit Agents.

4. Агенты-аватары. Tavus Conversational Video Interface и HeyGen Interactive Avatar рендерят говорящую голову в реальном времени. Подходят для клиентского сервиса, демо продаж, обучения. Сейчас задержка до первого слова 800 мс–1,2 с — приемлемо, но ещё не незаметно.

5. Модерация и безопасность контента. Распознавание языка вражды в реальном времени, флагирование токсичности, определение голоса несовершеннолетнего. Критично для социального потребительского сегмента. Запускается как LiveKit Agent или как кастомный вебхук поверх Agora/Zoom.

Если хотя бы одно из этих пяти направлений в вашей 12-месячной дорожной карте — это весомый голос за LiveKit Cloud (или self-hosted LiveKit). Фреймворк Agents позволяет реализовать их как Python- или Node-сервисы, заходящие в комнаты как участники, — это радикально проще, чем прикручивать AI к закрытому SDK.

Соответствие требованиям в деталях: HIPAA, GDPR, TCPA, SOC 2

Соответствие требованиям — это область, где аргумент «купите white-label» окреп сильнее всего между 2024 и 2026. Десятилетие правоприменительной активности и несколько громких штрафов заставили вендоров поставлять соответствие из коробки.

HIPAA (здравоохранение США):

Требует подписанного Business Associate Agreement (BAA), шифрования при передаче и хранении и логирования доступа. Предварительно подписанные BAA доступны у Whereby, Doxy.me, Zoom SDK, VSee и Sendbird. SDK уровня LiveKit Cloud и Agora предлагают BAA по запросу, обычно в течение недели после корпоративного контракта.

Контекст 2026: Office for Civil Rights активно применяет санкции с 2024 года, после периода пандемийной мягкости. Так что пропускать BAA дорого. Расчёт рисков сместился: используйте одобренную платформу или ждите штрафов с шестизначными числами.

GDPR (ЕС/Великобритания):

Требует локализации данных (дата-центры в ЕС), Data Processing Agreement (DPA) и прав пользователей (доступ, удаление, переносимость). Whereby нативно работает в точках присутствия ЕС. LiveKit Cloud, Agora и Daily предлагают регионы ЕС. Самая сильная позиция — self-hosting в собственном облаке в ЕС.

Контекст 2026: EDPB усилил координацию между DPA государств-членов, стандартизировав правоприменение по требованиям прозрачности. Ваша политика конфиденциальности должна раскрывать, какие именно данные обрабатываются, где и как долго. Метаданные видео и аудио тоже считаются.

TCPA (телекоммуникации США):

Применяется, когда приложение инициирует исходящие звонки (в том числе видео) без согласия пользователя. На уровне SDK не контролируется — ответственность на вашем продукте. Решение FCC от февраля 2024 квалифицировало голос, сгенерированный AI, в исходящих звонках как подпадающий под TCPA. Если ваш сценарий включает звонки AI-агентов пользователям — потоки согласия не обсуждаются.

SOC 2 Type II:

Сторонний аудит вашей инфраструктуры, контроля доступа и доступности. Доступен у всех крупных SDK-вендоров (Agora, LiveKit, Daily, 100ms, Zoom) и white-label-платформ (Whereby, Sendbird). Self-hosted означает собственный аудит — бюджет 1,5–4,5 млн ₽ в год.

Шорткат по соответствию: если вы в здравоохранении, образовании или финансовых услугах и должны выпустить релиз меньше чем за 8 недель, стартуйте на Whereby или Zoom SDK. Только предварительно подписанные BAA экономят 3–6 недель юридической проверки против нового SDK-вендора. Мигрировать всегда можно потом, когда соответствие стабилизируется.

Плейбук: телемедицина

Рекомендуемый стек: Zoom Video SDK или Whereby Embedded для MVP; LiveKit Cloud (или self-hosted), когда нужны AI-сортировка пациентов, перевод или полная локализация данных.

У телемедицины самый понятный паттерн из всех. MVP должен выходить с уже решённым HIPAA, с UX врача, который повторяет существующие процессы (приглашение в календаре → кликабельная ссылка → зал ожидания → консультация → заметки), и с интеграцией с EHR через вебхук или HL7. Whereby закрывает первые три из коробки; Zoom SDK выигрывает, когда клиника уже работает в Zoom.

Юнит-экономика при 10 тыс. визитов в месяц, средняя длительность 20 минут: Zoom SDK по ~0,26 ₽/мин даёт ежемесячный счёт около 525 тыс. ₽. Whereby с переплатами выходит ближе к 300–375 тыс. ₽. LiveKit Cloud на тарифе Scale — около 225–300 тыс. ₽, но UX вы строите сами больше.

Мы выпускали телемедицинские платформы на всех трёх путях: Whereby — для небольшой специализированной клиники в США (запуск за 5 недель), Zoom SDK — для госпитальной сети (уже была корпоративная подписка Zoom), и LiveKit Cloud — для AI-first продукта сортировки пациентов, где агенты заходят в звонки. Путь LiveKit дороже в инженерии, но окупается скоростью добавления AI-функций.

Плейбук: EdTech-классы

Рекомендуемый стек: Whereby для SMB и репетиторства; LiveKit Cloud или Agora для масштаба (школы K-12, MOOC).

Учителям нужны три вещи от видео: URL комнаты, по которому могут кликнуть даже родители, breakout-комнаты, не требующие админских прав, и посещаемость, которая попадает в LMS. Whereby даёт всё три. Agora или LiveKit дадут то же, но после того, как вы построите UX — и это оправдано, начиная примерно с 50 тыс. учеников, где юнит-экономика переворачивается.

Ключевая функция, которую стоит планировать на 2026: AI-репетиторы, заходящие в комнаты. Репетиторы на базе Claude или GPT, отвечающие на вопросы по домашке, проводящие устные опросы или сигнализирующие о застрявших учениках. Это паттерн LiveKit Agents; у Whereby нативно его не разместить.

Мы выпускали EdTech на Agora (маркетплейс изучения языков), LiveKit Cloud (платформа AI-репетиторства) и Whereby (стартап коучинга в малых группах). Правильный выбор почти всегда определяется тем, есть ли в дорожной карте AI-агенты.

Плейбук: корпоративные SaaS-конференции

Рекомендуемый стек: Daily Prebuilt для самого быстрого встраивания; LiveKit Cloud, когда нужны AI-заметки или кастомные элементы управления.

Паттерн B2B SaaS-конференций — встроить видеозвонок в CRM, систему управления проектами или HR-инструмент — это почти всегда маленькие группы (1–4 участника), много скриншаринга и опциональная запись. Одновременная нагрузка низкая. Юнит-экономика на стороне white-label или лёгкого SDK.

AI-сводка — обязательная функция 2026 года. Если ваш покупатель сравнивает вашу CRM с конкурентами, и у одной из них «AI делает заметки и подвязывает их к сделкам», — побеждает она. LiveKit Agents превращает это в ~2 недели инженерной работы; на Daily или Agora — ближе к 4–6 неделям.

Пример Фора Софт: мы собрали B2B-SaaS-слой конференций для платформы продажного энейблмента на LiveKit Cloud плюс агент-заметочник на Claude. Весь стек ушёл в продакшен за семь недель. Полный счёт за платформу при 8 тыс. активных пользователей в месяц остался ниже 300 тыс. ₽/мес.

Плейбук: социальное потребительское видео

Рекомендуемый стек: Agora для глобального масштаба, LiveKit Cloud для AI-нативных потребительских приложений.

Социальное потребительское видео — приложения в духе Discord, дейтинг, комнаты креаторов, drop-in аудио и видео — живёт или умирает по задержке и юнит-экономике. SD-RTN от Agora даёт преимущество по задержке в APAC. LiveKit выигрывает, когда AI-фильтры, перевод или агенты-аватары и есть продукт.

При 100 тыс. MAU и сессиях по 10 минут любая из платформ укладывается в чистую стоимость видео ниже 150 тыс. ₽/мес. При 1 млн MAU и смешанном использовании вы подходите к точке окупаемости self-hosting — заранее проектируйте путь миграции.

Социальное потребительское — это и сегмент, где модерация важнее всего. AI-модерация в реальном времени (распознавание языка вражды, обнаружение голоса несовершеннолетнего, NSFW-определение изображений в видео) обязательна в 2026 и тривиально запускается как LiveKit Agent — а пристёгивать её к закрытым SDK сложнее.

Плейбук: маркетплейс — связь с продавцом

Рекомендуемый стек: Whereby Embedded или Sendbird Calls для MVP; не мигрируйте, пока объём не оправдает.

Маркетплейс-видео (связь с продавцом на платформах в стиле Carousell, демо товаров покупателю, прогулки по объектам недвижимости) — почти всегда один-на-один, короткие сессии (менее 10 минут), без записи. Whereby Embedded по 5 925 ₽/мес + потребление — самый чистый путь. Sendbird разумен, когда вы уже выпускаете с этим вендором чат.

Не переусложняйте здесь. Набор функций узкий, юнит-экономика тонкая, репутационный риск от провального звонка высокий. Покупайте white-label, выпускайте за четыре недели и возвращайтесь к решению о платформе, только если пересечёте 100 тыс. сессий с продавцами в месяц.

Юнит-экономика на 100 тыс. и 1 млн MAU

Реальная математика build vs buy зависит от вашего паттерна использования. Ниже — две распространённые формы. Допущения: средний размер группы 2–3, медианная сессия 10–15 минут, качество 720p, трафик США + ЕС.

Масштаб Whereby Embedded LiveKit Cloud Agora SDK LiveKit self-hosted
100 тыс. MAU~450 тыс. ₽/мес (упор в потолок)~300 тыс. ₽/мес~375 тыс. ₽/мес~1 млн ₽/мес (с инженером)
1 млн MAUКорпоративный прайс, >2,2 млн ₽/мес~1,8 млн ₽/мес~2,2 млн ₽/мес~1,6 млн ₽/мес

Рис. 6. Только направление; корпоративные контракты и паттерны использования заметно сдвигают цифры.

Три вывода: (1) white-label дешевле всего на малом объёме, но рано упирается в корпоративный прайс; (2) self-hosting дешевле управляемого после ~500 тыс. MAU, но только если правильно учесть инженера; (3) разрыв между лучшим и худшим вариантом на 1 млн MAU — около 600 тыс. ₽/мес — значимый, но сам по себе не решающий. Задержка, соответствие требованиям и AI-функции обычно весят больше, чем строка в прайс-листе.

Хотите эту математику под свои реальные цифры?

Пришлите прогноз MAU, размер группы и длительность сессии — вернём кривую затрат на 3 года по всем четырём путям.

Позвоните нам → Напишите нам →

Восемь ошибок основателей

Эти ошибки мы видим каждый год. Каждая из них стоит 3–9 месяцев инженерной работы или шестизначного счёта за платформу — и каждая абсолютно избегаема.

1. Слишком дешёвый white-label, упор в потолок на 50 тыс. MAU. Команда экономит 150 тыс. ₽/мес на старте, потом обнаруживает потолок в 50 участников на комнату, 30-дневное хранение записей и корпоративный прайс при росте. Стоимость разворота: трёхмесячная миграция и риск даунтайма для пользователей.

2. Слишком кастомный WebRTC, кончается раннер. Команда выпускает MVP за три месяца, набирает 10 тыс. пользователей, выясняет, что self-hosted mediasoup обходится в 225 тыс. ₽/мес плюс DevOps на полную ставку. Переходит на Agora SDK с мгновенным ростом затрат в 3–5 раз. Надо было сразу стартовать на SDK или с первого дня заложить операционные затраты на self-hosting.

3. Игнорирование противоречия E2EE и записи на раннем этапе. Собирают продукт, добавляют E2EE ради приватности, потом корпоративный клиент просит запись. Понимают, что архитектурно E2EE ломает серверную запись. Либо снимают E2EE (недовольные пользователи), либо теряют клиента.

4. Переплата за глобальный масштаб, когда вы обслуживаете один регион. Берут Agora «ради глобального масштаба», но 90% пользователей в США. Платят за точки присутствия в APAC, которыми никто не пользуется. Daily, LiveKit Cloud или даже Whereby стоили бы дешевле.

5. Привязка к закрывающемуся вендору. Стартуют на Twilio Video в 2024, в 2025 получают письмо о миграции, в 2026 переписывают. Стоимость переезда превышает стоимость выбора LiveKit или Agora с самого начала.

6. Допущение, что премиум-видео — это статья выручки. Запускают «премиум-качество видео» апселлом за 750 ₽/мес и ждут, что заплатят. Не платят. Видео в 2026 — товар; никто не доплачивает за слегка большую полосу пропускания. Деньги приносит AI, а не качество кодека.

7. Путаница между «низкой» и «сверхнизкой» задержкой. Читают, что стандарт — ниже 200 мс, и берут самый дорогой тариф Agora. А пользователям комфортно при 400 мс. Половина счёта за платформу уходит на задержку, которая не нужна. 200–500 мс приемлемо для социального видео; ниже 100 мс нужно только для телетерапии, игр или действительно совместной работы в реальном времени.

8. Сюрпризы со стоимостью хранения записей. Включают запись на Whereby/Daily для всех звонков. На масштабе обнаруживают, что хранение и исходящий трафик стоят 3,7 млн ₽ и больше в месяц. Надо было использовать запись по инициативе пользователя, проброс в собственный S3 или ступенчатое хранение по тарифу.

Паттерн за каждой ошибкой: недооценка TCO на горизонте трёх лет и переоценка стоимости месяца запуска. Правильное решение минимизирует стоимость миграции на следующем масштабе, а не даёт самый дешёвый первый счёт.

FAQ

LiveKit действительно выбор по умолчанию в 2026?

Для большинства новых проектов — да. Три причины: тариф Cloud конкурентоспособен против Agora и Daily; open source self-host даёт запасной выход, если цены изменятся; фреймворк Agents делает AI-нативный видеочат заметно проще, чем на закрытых SDK. Agora всё ещё правильный выбор для APAC-трафика и экстремального глобального масштаба, а Zoom SDK выигрывает, когда корпоративный заказчик стандартизирован на Zoom.

Сколько на самом деле стоит MVP видеочата в 2026 году?

White-label (Whereby Embedded) выходит за 4–6 недель: фиксированная месячная подписка плюс потребление. Типичный бюджет MVP — 1,5–3 млн ₽ на инженерию плюс ~15 тыс. ₽/мес на платформу. MVP на SDK (LiveKit Cloud или Agora) обычно занимает 8–12 недель при бюджете 4,5–9 млн ₽ на инженерию плюс плата за платформу. Практика Agent Engineering в Фора Софт сжимает эти сроки на 30–40% за счёт AI-ассистированной генерации кода.

Стоит ли использовать Twilio Video для нового проекта?

Нет. Twilio с 2024 года переводит клиентов на Zoom Video SDK. Новые проекты стоит запускать сразу на LiveKit Cloud, Agora или Zoom SDK. Если у вас уже есть продукт на Twilio Video, запланируйте миграцию в ближайшие 12–18 месяцев — наш плейбук миграции описывает шаги.

Какой самый дешёвый видеочат с HIPAA?

Whereby Embedded (5 925 ₽/мес + потребление) и Doxy.me (от 5 925 ₽/мес) — самые дешёвые пути с уже настроенным HIPAA. Zoom SDK дороже по минуте, но упаковывает соответствие в корпоративные процессы, которым доверяют системы здравоохранения. Пути на SDK (LiveKit, Agora) подписывают BAA на корпоративных контрактах, но добавляют примерно 3–6 недель юридической проверки.

Когда self-hosting действительно экономит деньги?

Примерно с 2 млн участнико-минут в год, как только заложите постоянного инженера DevOps. Ниже — управляемые SDK дешевле. Выше — self-hosted LiveKit или mediasoup могут сократить платформенный счёт вдвое, но за вами дежурство, обновления кодеков и матрица совместимости браузеров. Основатели стабильно недооценивают «налог» на эксплуатацию в 2–3 раза.

Можно ли одновременно иметь E2EE и запись?

Не чисто на масштабе в 2026. E2EE означает, что сервер не может расшифровать медиа, а значит не может их компоновать или записывать. Практические обходы: (а) запись на клиенте с загрузкой зашифрованных блобов, (б) compliance-запись без E2EE (большинство кейсов в здравоохранении и корпоративном сегменте) или (в) гибридные архитектуры, где определённые потоки идут в обход E2EE. У каждого варианта реальные компромиссы; решайте до фиксации архитектуры.

Сколько инженерной работы добавляет AI-нативный видеочат?

На LiveKit с Agents — 1–3 недели, чтобы получить первого голосового агента (перевод, заметочник, AI-интервьюер) в комнатах. На Agora, Daily или Zoom SDK ближе к 4–8 неделям, потому что слой оркестрации придётся собирать самим. Наш плейбук по голосовому AI покрывает весь стек.

Помогает ли Фора Софт и с решением, и с разработкой?

Да. Типичный проект начинается с 72-часового discovery: мы разбираем ваш паттерн использования, требования к соответствию и дорожную карту, возвращаем рекомендацию с 3-летней кривой затрат. Если вы двигаетесь с нами дальше, практика Agent Engineering выпускает MVP за 6–12 недель на выбранном стеке. Мы реализовали проекты на каждом из путей.

Миграция

Build vs Buy: переход с видео-SDK на собственную платформу

Уже на SDK? Здесь — когда экономика миграции начинает играть в пользу self-hosted.

Голосовой AI

LiveKit Voice AI: инженерный плейбук

Как выпускать человекоподобных голосовых агентов с задержкой ниже 700 мс на LiveKit Agents 1.x.

Архитектура

Собираем приложение для видеостриминга: технические нюансы

Широкий обзор стека — компромиссы VOD, live и конференций.

Топологии

P2P vs MCU vs SFU для видеоконференций

Когда mesh-топология действительно работает и почему SFU становится выбором по умолчанию выше шести участников.

Вендор

Альтернативы Agora в 2026 году

Шорт-лист для команд, смотрящих за пределы Agora — когда LiveKit, Daily или 100ms подходят лучше.

Безопасность

Функции безопасности видеостриминга

DRM, токен-аутентификация, шифрование записей, E2EE — чеклист безопасности на 2026.

Готовы выбрать правильный путь для платформы видеочата?

Фреймворк четырёх путей сворачивает решение build vs buy в 30-минутное упражнение: определите использование, соответствие требованиям, AI-дорожную карту и раннер, а затем сопоставьте их с покупкой white-label, лицензированием SDK, self-hostom OSS-движка или сборкой кастомного стека. Большинство основателей выбирают неверный путь, потому что переоценивают скорость запуска и недооценивают юнит-экономику через 18 месяцев: платформы на управляемом SDK раздуваются до семизначных годовых счетов быстрее, чем ожидается, а кастомные сборки выталкивают точку окупаемости за пределы большинства сидовых раннеров.

Фора Софт реализовала проекты на каждом из путей — Agora, Daily, LiveKit Cloud, self-hosted LiveKit, mediasoup и полностью кастомные WebRTC SFU. Правильный ответ определяется вашими цифрами, а не вкусом в стеках. Если вы в начале пути, SDK доводит до product-market fit за недели. Если вы уже выше 2 млн участнико-минут в год и AI-функции — ядро продукта, self-hosted LiveKit или кастомная сборка окупаются за год. В любом случае самое дешёвое решение — то, которое вы принимаете до того, как выпустили неверную архитектуру.

Готовы выбрать между Buy, SDK, OSS и Custom?

Свяжитесь с нами на 30-минутный архитектурный созвон. Мы проведём ваш сценарий через фреймворк четырёх путей и вернём рекомендацию вместе с планом миграции.

Позвоните нам → Напишите нам →

  • Технологии