Архитектура ИИ-скрайба в 2026: как построить production-систему амбиентного документирования

Главное

• ИИ-скрайб (AI scribe) — главное killer-приложение медицинского ИИ в 2026 году. Abridge привлёк 22 млрд ₽ в раунде Series D, Suki и Nuance DAX (Microsoft) масштабировались до десятков тысяч клиницистов, а амбиентное документирование — редкая категория ИИ, в которой ROI на пользователя окупается уже в первый месяц.

• Архитектура состоит из семи стадий, а не одной модели. Захват аудио → диаризация → медицинский ASR → LLM с клиническим RAG → генерация SOAP → подсказка кодов CPT/ICD-10 → запись в EHR. Пропустите любую стадию — и продукт провалится во внедрении.

• HIPAA — задача сложнее, чем сам ИИ. BAA на каждом узле, покрытие аудиомодальности у облачных LLM (OpenAI Realtime API в 2026 году ещё не покрыт большинством BAA — проверьте перед запуском), шифрование в транзите и в покое, неизменяемость аудит-логов и путь удаления, согласованный с правилом 6-летнего хранения.

• Три жизнеспособных экономических сценария. Купить Abridge / Suki / DAX (~15–30 тыс. ₽ на клинициста в месяц, быстрее всего к запуску, данные уходят вендору). Сделать white-label на партнёрской модели (~6–12 тыс. ₽ на клинициста в месяц, быстрый старт, меньше контроля). Сделать собственное решение (12–20 недель разработки, 30–105 млн ₽, ~1 875–4 500 ₽ на клинициста в месяц на эксплуатацию, полный контроль над данными и IP).

• Главная победа — это сэкономленное время, а не точность транскрипта. Полезный скрайб экономит клиницисту 60–120 минут в день на «ночной» дописке карт. Оптимизируйте round-trip от «остановил запись» до «черновик заметки готов в EHR» меньше чем за 90 секунд, а не десятые доли WER, за которыми вы привыкли гнаться.

Почему Фора Софт написала этот плейбук

Фора Софт уже два десятилетия выпускает HIPAA-совместимые телемедицинские и клинические платформы. Мы построили и продолжаем поддерживать CirrusMED — продукт первичной телемедицинской помощи в США, работающий под HIPAA-программой безопасности с BAA по всему стеку. Мы построили TransLinguist — платформу видеомедицинского перевода, законтрактованную в британский NHS, — и платформу телефонного больничного перевода для регулируемых трастов. Захват аудио в клинических условиях, цепочки BAA, границы шифрования в транзите, интеграция с EHR через FHIR и UX-согласие, удерживающие продукт в рамках комплаенса, — это всё области, в которых мы уже выпускали продукты.

В 2025–2026 годах мы провели технический due diligence двух AI-scribe-стартапов на стадии pre-Series-A и выпустили расширение для амбиентного документирования поверх существующего телемедицинского продукта. Шаблоны в этом руководстве — из тех проектов плюс из публичных источников: продуктовых раскрытий Abridge, Suki и Nuance DAX, документации OpenAI Realtime API и их BAA-позиции, технического брифа AWS HealthScribe и рекомендаций AMA / AMIA по применению ИИ в клиническом документировании.

Если вы основатель телемедицинского сервиса, добавляющего амбиентное документирование, CIO больницы, оценивающий Abridge / Suki / DAX, AI-product-стартап в здравоохранении, выбирающий между сборкой и партнёрством, или вендор EHR, исследующий встроенный скрайб, — это руководство даёт вам архитектуру, реальность HIPAA, расчёты на одного клинициста и план запуска на 16–20 недель, который мы используем с собственными клиентами.

Строите кастомный ИИ-скрайб под конкретную специальность?

Бесплатное 30-минутное скоупинг-обсуждение. Мы оценим объём работ, перечислим вендоров с BAA, набросаем план на 16 недель и принесём паттерны HIPAA в стиле CirrusMED, которые мы уже эксплуатируем.

Позвоните нам → Напишите нам →

Почему ИИ-скрайб — главное killer-приложение медицинского ИИ в 2026

У медицинского ИИ было шумное десятилетие пилотов, которые так и не закрепились. В 2024–2025 годах амбиентное документирование сломало этот шаблон, потому что ROI здесь необычно прозрачный: клиницист тратит 1–2 часа каждый вечер на «ночную» дописку карт после последнего пациента. Рабочий скрайб возвращает это время. Net Promoter Score у клиницистов, использующих Abridge, Suki или DAX, держится в диапазоне +60…+80 — редкость для любого корпоративного ПО, не говоря уже про здравоохранение.

Категорию вытолкнули в центр три структурных сдвига. Первый — LLM класса GPT в 2023–2024 годах сделали медицинскую суммаризацию достаточно надёжной для черновика заметки. Второй — вендоры EHR (Epic, Oracle Health, athenahealth) построили дружелюбные к скрайбам API записи, потому что этого потребовали системы здравоохранения. Третий — плательщики и CMS негласно приняли заметки, сгенерированные ИИ, как документацию официального уровня, при условии что клиницист их проверяет и подписывает.

Реакция рынка получилась агрессивной. Abridge — 22 млрд ₽ в Series D в 2024 году. Suki и DAX (Microsoft) масштабировались в тысячи систем здравоохранения. Heidi, Augmedix, Doximity, Nabla, Freed, ScribeAmerica — все выпускают свои варианты продукта. Поэтому в 2026 году вопрос «строить или купить» актуален для каждого CIO системы здравоохранения, каждого основателя телемедицинского сервиса и каждого вендора EHR.

Что такое ИИ-скрайб на самом деле

ИИ-скрайб — это не инструмент транскрипции. Это сквозной пайплайн, который берёт разговор клинициста с пациентом — в кабинете или по телемедицине — и формирует структурированную клиническую заметку (обычно SOAP — Subjective, Objective, Assessment, Plan), а также подсказывает биллинговые коды и записывает результат в EHR на проверку и подпись клиницистом.

1. Это амбиентный продукт. Клиницист не диктует. Микрофон работает фоном на протяжении всего приёма. Захватываются оба собеседника. Модель должна извлечь клинические факты из разговора, а не из структурированной диктовки.

2. Это структурированный вывод. На выходе не абзац транскрипта. Это SOAP-заметка в той форме, в которой реально читается медицинская карта: Chief Complaint, History of Present Illness, Review of Systems, Physical Exam, Assessment, Plan плюс инструкции пациенту. У каждой секции — свой целевой стиль и длина.

3. Это продукт, понимающий биллинг. Ценный скрайб также подсказывает коды CPT и ICD-10 из контекста разговора (а не просто по поиску ключевых слов). Клиницист проверяет подсказки; revenue cycle отыгрывает обратно время и точность.

4. Это интегрированный продукт. Клиницист не должен ничего копипастить. Заметка возвращается в Epic / Cerner / athena / кастомный EHR через FHIR, HL7v2 или вендорский API записи. Без интеграции продукт превращается в гимик для повышения продуктивности.

5. Это HIPAA-grade-продукт. Аудио — это PHI с момента захвата. Пайплайн живёт внутри цепочки BAA, шифрует в транзите и в покое, удерживает аудит-логи и поддерживает согласие пациента и его отзыв.

Семистадийная референсная архитектура

Каждый выпущенный в 2026 году скрайб — Abridge, Suki, DAX, Heidi, Nabla, AWS HealthScribe, наши кастомные сборки — сводится к одному и тому же семистадийному пайплайну. Реализации, вендорские вызовы и место оркестрации различаются. Форма — нет.

Следующие разделы разбирают каждую стадию. Они идут в том порядке, в котором аудио реально движется — от захвата до записи в EHR, — чтобы решения по каждой стадии оседали в контексте того, что им предшествует и что за ними следует.

Стадия 1 — Захват аудио и HIPAA-совместимая инфраструктура

Захват аудио — точка, где начинается история HIPAA. Две поверхности: очные приёмы (приложение для iOS / Android, десктопный helper, USB-микрофон с beamforming) и телемедицинские приёмы (хук в WebRTC-поток). Для очных приёмов предпочтительнее микрофон с beamforming (например, серия Shure MXA или USB-микрофон за 2 250 ₽ от поставщика клинического оборудования) — он подавляет второй голос, шум вентиляции и стук по клавиатуре. Для телемедицины захватывайте аудио со стороны ингеста — после эхоподавления, но до сведения.

Кодек и частота дискретизации важны для нижестоящего ASR. 16 кГц моно PCM (или 16 кГц Opus на 32–64 кбит/с) — золотая середина. Ниже 16 кГц начинает страдать ASR на медицинских терминах; выше — это просто потраченная полоса пропускания на телефонных микрофонах.

Инфраструктура должна быть HIPAA-совместимой от края до края. Используйте регион AWS / GCP / Azure, в котором у вендора есть HIPAA-совместимый BAA. Шифруйте аудио в покое ключами KMS под управлением провайдера. Шифруйте в транзите по TLS 1.2 или выше. Сырое аудио храните только пока оно нужно (большинство операторов удаляет его в течение 30 дней; некоторые хранят дольше для дообучения по явному согласию пациента). Аудио — это PHI; относитесь к bucket / topic / queue как к носителю PHI целиком.

Берите микрофон с beamforming, когда: доминируют очные приёмы, кабинеты шумные или клиницист перемещается по кабинету во время визита. Только-телемедицинские сценарии могут пропустить этот шаг полностью.

Стадия 2 — Диаризация спикеров

Диаризация отвечает на вопрос «кто что и когда сказал». В большинстве случаев спикеров двое (клиницист и пациент), но в реальных приёмах участвуют родственники, опекуны, переводчики и медицинский ассистент. Готовые инструменты — pyannote.audio (золотой стандарт офлайн-диаризации), встроенная диаризация AWS Transcribe Medical, NVIDIA NeMo и API диаризации AssemblyAI.

Полезный паттерн — диаризовать дважды. Онлайн, в реальном времени, быстрой моделью (точность ниже, нужна для живого UI, показывающего, кто сейчас говорит). Офлайн, после визита, pyannote или NeMo на полном аудио (точность выше, идёт в LLM). Стоимость двойного прохода невелика, а точность офлайн-прохода влияет на качество заметки сильнее, чем шаг ASR.

Берите офлайн-передиаризацию, когда: качество заметки важнее задержки UI, в визите больше двух спикеров или правки клиницистов после визита кучкуются вокруг неверной атрибуции спикеров.

Стадия 3 — ASR с медицинским контекстом

Медицинский ASR — место, где универсальные транскрипционные инструменты ломаются. Названия препаратов, дозировки, анатомия, аббревиатуры, лабораторные значения и термины процедур — это длинный хвост словаря, по которому коробочный ASR будет угадывать. Жизнеспособные варианты в 2026 году: AWS Transcribe Medical, Microsoft Azure Healthcare Speech, медицинская модель AssemblyAI, Deepgram Nova-2 medical, NVIDIA Parakeet-MED и self-hosted Whisper с клиническим лексиконом и доменно-настроенным beam-search-рескорером.

Word error rate — неправильный KPI для медицинского ASR в одиночку. Правильный KPI — recall медицинских сущностей: поймал ли ASR название препарата, дозу, путь введения, частоту? Поймал ли термин анатомии и название процедуры? Записал ли правильное состояние с кодом ICD-10? Соберите hold-out-набор из 200–500 сегментов визита и измеряйте recall сущностей по каждой специальности.

Растущий паттерн — кормить LLM сырой транскрипт ASR вместе с эмбеддингом аудио (или низкобитным представлением аудио). LLM может поправить ошибки ASR, используя контекст, до которого текстовый постпроцессинг не достанет. Этот паттерн используют AWS HealthScribe и часть кастомных сборок; в наших тестах он поднимает recall сущностей на 4–8 процентных пунктов.

Берите self-hosted Whisper, когда: резидентность данных не обсуждается, нужен полный контроль над артефактом модели или покрытие BAA вендора в нужном облачном регионе неполное.

Стадия 4 — LLM с клиническим RAG

LLM — мозг скрайба. Она берёт диаризованный, прошедший ASR транскрипт и формирует шаги клинического рассуждения, которые превращают разговор в структурированную заметку. Жизнеспособные субстраты LLM в 2026 году (под BAA): Anthropic Claude в AWS Bedrock в HIPAA-совместимом регионе, модели класса GPT-4 в Azure OpenAI под healthcare-BAA Microsoft, Google Gemini в Vertex AI в HIPAA-совместимом регионе и self-hosted-модели на открытых весах (Llama-3-класса, Mistral, производные MedAlpaca) для заказчиков со строгой резидентностью.

Клинический RAG — отличающий фактор, который превращает универсальный суммаризатор в полезный скрайб. Заземляйте каждую генерацию заметки на: предыдущую карту пациента (problem list, аллергии, лекарства, прежние заметки), предпочтительные шаблоны клинициста (заметка-наблюдение в дерматологии и приём в OB-GYN выглядят очень по-разному), релевантные клинические гайдлайны для основной жалобы и формуляр практики. RAG поверх записей видео, аудио и чатов имеет ту же форму; клинический RAG просто строже относится к provenance.

Стадия 5 — Генерация SOAP-заметки

Формат SOAP — Subjective, Objective, Assessment, Plan — это канонический способ структурировать клиническую заметку в амбулаторной практике в США. У каждой секции свои ограничения. Subjective — краткая проза («пациент сообщает…»). Objective — плотные булиты с физикальными находками. Assessment — нумерованный дифференциальный диагноз. Plan — нумерованный список действий с медикаментами, дозировками, follow-up и образованием пациента.

Генерируйте четыре секции четырьмя проходами LLM, а не одним гигантским промптом. У каждого прохода — свой системный промпт, свой набор retrieval и свой бюджет длины. Этот паттерн снижает галлюцинации, делает регрессионное тестирование посекционно отслеживаемым и позволяет клиницисту править одну секцию, не ломая другую. Мы также делаем отдельный проход «patient-facing summary» для раздаточных материалов с резюме визита.

Берите четырёхпроходный паттерн SOAP, когда: галлюцинации в одно-промптной базовой реализации превышают 1 %, правки клинициста кучкуются в одной секции (обычно Plan) или специализированные шаблоны требуют строгого посекционного форматирования.

Стадия 6 — Подсказка кодов CPT и ICD-10

Кодирование — место, где скрайб зарабатывает второй кусок ROI. Подсказывайте коды CPT (процедура / уровень визита E&M) и ICD-10 (диагноз) по контексту визита. Не выставляйте счета автоматически: клиницист или кодировщик проверяет и подписывает. Команды revenue cycle в больницах принимают кодирование с подсказкой ИИ только тогда, когда оно сопровождается оценкой уверенности и цитатой обратно к фрагменту разговора, который оправдывает код.

Соберите кодировщик как шаг LLM, который берёт SOAP-заметку плюс диаризованный транскрипт и выдаёт список кортежей (код, обоснование, фрагмент, уверенность). Закэшируйте справочники AMA CPT и CMS ICD-10 в индексе RAG. Перезапускайте кодировщик при каждой правке заметки, чтобы подсказанные коды отслеживали правки клинициста.

Стадия 7 — Запись в EHR

Запись в EHR — интеграция, которая выигрывает или проигрывает внедрение. Три полосы. 1. Запись через FHIR (Epic, Oracle Health/Cerner, athenahealth — все экспонируют ресурсы FHIR R4 DocumentReference и Encounter для записи заметок, всё чаще без отдельного интеграционного проекта на заказчика). 2. HL7v2 (легаси-системы по-прежнему опираются на сообщения ORU и MDM поверх MLLP). 3. Вендорские REST (Epic App Orchard / Showroom, Oracle Health Code Console, маркетплейс API athenahealth) — глубже хуки, но больше работы под каждого вендора.

Планируйте round-trip записи меньше 90 секунд — от «остановил запись» до «черновик заметки в worklist EHR». Медленнее — и клиницист перезапустит EHR вместо того, чтобы ждать. Прокэшируйте контекст пациента заранее (problem list, лекарства, аллергии, недавние визиты), чтобы стадия LLM стартовала в момент остановки записи.

Реальность HIPAA — аудиомодальность и цепочки BAA

Каждый внешний сервис, который касается аудио или транскрипта, должен находиться под Business Associate Agreement (BAA). Цепочка ломается на самом слабом звене. Ландшафт 2026 года в основном кооперативный: AWS, GCP, Azure, AssemblyAI, Deepgram, AWS HealthScribe, Anthropic в Bedrock, Microsoft Azure OpenAI — все подписывают BAA. Исключения, которые стоит проверять: аудиомодальность OpenAI Realtime API в 2026 году ещё не покрыта большинством виденных нами BAA (компания движется в эту сторону; уточните текущий текст BAA, прежде чем ставить продукт на Realtime audio в клинике). Прямые потребительские голосовые сервисы (ElevenLabs, публичные эндпоинты Whisper API), как правило, BAA не покрыты.

Неизменяемость аудит-лога имеет значение. Append-only-логи (CloudTrail с S3 Object Lock, Azure Monitor в неизменяемом режиме, Google Cloud Audit Logs в compliance-режиме) — это операционный ответ. Храните логи как минимум 6 лет, чтобы попасть в правило хранения HIPAA.

Удаление пациента — нетривиальная задача. Отзыв согласия пациентом должен запускать удаление аудио, транскрипта и любых артефактов обучения модели, при этом сохраняя клиническую заметку, которую клиницист подписал (заметка — это медицинская запись и регулируется законом штата о хранении, обычно 6–10 лет). Стройте граф данных так, чтобы аудио ↔ транскрипт ↔ подсказанные коды ↔ подписанная заметка были индивидуально адресуемы для удаления.

Abridge vs Suki vs Nuance DAX vs кастомное решение

Большинство сравнений сводится к четырёхстороннему. Ответ зависит от контроля данных, глубины интеграции с EHR, попадания по специальности и бюджета. Цены и фичи смещаются от квартала к кварталу; таблица ниже — снапшот по публичным материалам и разговорам с операторами на начало 2026 года.

Вариант	Ценовой диапазон	Интеграция с EHR	Контроль данных	Специализации
Abridge	~15–30 тыс. ₽ / клиницист / мес.	Глубокая Epic, Oracle, athena	Хостится у вендора	Сильны в первичной помощи, расширяют спектр
Suki	~11–22 тыс. ₽ / клиницист / мес.	Epic, athena, eClinicalWorks	Хостится у вендора	Мультиспециальность, сильны в кардио / орто
Nuance DAX (Microsoft)	~22–45 тыс. ₽ / клиницист / мес.	Нативная Epic, Cerner / Oracle	Хостится у Microsoft	Широкий спектр, уклон в энтерпрайз
AWS HealthScribe	По потреблению, ~7–22 ₽ / минута	DIY (собираете сами)	Ваш аккаунт AWS	Универсальный, специализацию настраиваете сами
Кастомная сборка (паттерн Фора Софт)	~1 875–4 500 ₽ / клиницист / мес. эксплуатации + 30–105 млн ₽ на разработку	Ваш стек, ваши приоритеты	Ваше облако, ваши BAA	Любая, под которую вы дообучаетесь

Два вывода. Первый: цена вендорских скрайбов на одного клинициста экономически имеет смысл для больниц со стабильным операционным бюджетом и неэкономична для телемедицинских платформ, которые платят эту сумму за каждого клинициста в своей сети. Второй: кастомная сборка окупается, когда у вас есть либо (а) больше ~600 клиницистов, либо (б) сильная специализация, которую вендоры не покрывают, либо (в) строгое требование к резидентности данных.

Дообучение под специальность — кардиология, дерматология, OB-GYN

Универсальный скрайб уверенно справляется с заметками в стиле первичной помощи. У специальностей свои словари, структуры и паттерны кодирования. Кардиологические заметки сильно опираются на результаты стресс-тестов, находки ЭКГ, фракцию выброса и терминологию кардиопроцедур. Дерматология живёт описаниями элементов, планами биопсии и ограниченным набором CPT-кодов (серия 17000). OB-GYN включает акушерский анамнез (нотация G/P), результаты УЗИ и быстро меняющийся пост-Dobbs правовой контекст, влияющий на клиническое документирование.

Прагматичное дообучение под специальность — это два прохода. Первый — доменно-специфический индекс RAG (корпус специализированных гайдлайнов, заметки той же специальности с кодами, специализированные шаблоны). Второй — небольшой SFT на нескольких тысячах заметок, отредактированных клиницистами в этой специальности. Полный LoRA / полный файнтюнинг базовой LLM редко требуется и редко окупается; путь «RAG плюс шаблоны» даёт большую часть прироста.

Модель затрат — экономика на одного клинициста

У кастомного скрайба три статьи затрат: разработка, эксплуатация и операции. Разработка — 16–20-недельный инженерный цикл: 30–105 млн ₽ в зависимости от количества специальностей, глубины EHR и от того, начинаете ли вы с готовой части пайплайна. Эксплуатация — стоимость инфраструктуры на визит: ASR ~3 ₽/мин, токены LLM ~3–7,5 ₽/заметка, инфраструктура и наблюдаемость ~1,5 ₽/визит, амортизация коннектора EHR. Типичный день клинициста на 18 визитов стоит около 67–135 ₽ в сырой инфре; округляя на пятидневную неделю и 48 рабочих недель — около 1 875–4 500 ₽ на клинициста в месяц.

Операции — это человеческая стоимость поддержания модели в форме: небольшая команда clinical-AI, которая разбирает крайние случаи, переобучает модули по специальностям, мониторит частоту галлюцинаций и принимает решения по запросам пациентов на удаление. Закладывайте одного клинического инженера на 2 000 клиницистов в стационарном режиме и part-time-клинического ревьюера с медицинским образованием.

Системам здравоохранения, сравнивающим цену на покупку Abridge (15–30 тыс. ₽ / клиницист / мес.) и all-in-стоимость кастомной сборки (3 375–6 000 ₽ / клиницист / мес. на масштабе), точка безубыточности — около отметки в 600 клиницистов. Меньше — покупайте. Больше — обычно выигрывает кастомная сборка, особенно когда вы добавляете опасения насчёт контроля данных у вендора и выгодные условия, которые можно выторговать на общей инфраструктуре.

Согласие пациента — поверхность, которую пациент видит и которую регулятор измеряет. Постройте понятный UX, в котором пациенту сообщается: (а) что записывается, (б) как это используется, (в) у кого есть доступ, (г) как долго это хранится и (д) как пациент может отозвать согласие. Формулировки должны быть короткими и простыми («Этот визит записывается, чтобы клиницист мог уделить вам больше времени»); юридическая обвязка живёт в политике конфиденциальности и BAA, а не в UI согласия.

В штатах с правилом одностороннего согласия (большинство штатов США) юридически требуется только согласие со стороны клинициста, но любой серьёзный скрайб всё равно спрашивает у пациента, потому что внедрение зависит от его комфорта. В штатах с двусторонним согласием (Калифорния, Флорида, Иллинойс, Мэриленд, Массачусетс, Монтана, Невада, Нью-Гэмпшир, Пенсильвания, Вашингтон по состоянию на 2025 год) явный opt-in пациента обязателен; не запускайтесь без него.

Мини-кейс — слой скрайба в стиле CirrusMED

Телемедицинский оператор, использующий инфраструктуру в паттерне CirrusMED, попросил нас добавить амбиентный скрайб поверх существующего продукта видеовизитов. У них работало около 220 клиницистов в первичной помощи и поведенческом здоровье, интеграция с athenahealth и кастомным внутренним EHR, и они хотели держать аудио в собственном аккаунте AWS.

Мы выпустили решение за 17 недель. Стек: AWS Transcribe Medical для ASR, pyannote.audio для офлайн-передиаризации, Anthropic Claude в Bedrock для четырёхпроходной генерации SOAP и подсказчика CPT / ICD-10, индекс RAG в OpenSearch с прежней картой, problem list и шаблонами клиницистов, запись через FHIR DocumentReference в athena и кастомный путь HL7v2 во внутренний EHR. Согласие пациента добавлено как в предвизитный поток пациента, так и на in-visit-экран.

По итогам первого квартала: средняя «ночная» дописка карт упала с 1 ч 48 мин до 22 мин на клинициста в день, NPS клиницистов по скрайбу — +71, объём правок заметок снижался от недели к неделе по мере приземления специализированных дообучений, а revenue-cycle-команда оператора принимала подсказанное ИИ кодирование в 84 % визитов без переделки кодировщиком. Хотите похожий проект? Позвоните или напишите нам.

Нужен HIPAA-совместимый ИИ-скрайб за 16 недель?

Бесплатное 30-минутное скоупинг-обсуждение. Мы вернёмся со списком вендоров с BAA, постадийной архитектурой, моделью затрат на одного клинициста и планом доставки.

Позвоните нам → Напишите нам →

Фреймворк решения в пяти вопросах

Пройдите пять вопросов ниже, прежде чем выбрать «строить», «купить» или «партнёриться». Ответы определят, какая полоса вам подходит.

1. Сколько клиницистов? Меньше ~250 — покупайте Abridge или Suki и запускайтесь за недели. От 250 до 600 — оценивайте AWS HealthScribe плюс тонкий кастомный слой или партнёрскую модель. Больше 600 — кастомная сборка обычно выигрывает по 24-месячному TCO.

2. Какой состав EHR? Все-Epic-площадки могут позволить себе самого глубоко интегрированного вендора (Abridge или DAX). Гетерогенный состав EHR двигает в сторону кастомной сборки или связки HealthScribe с кастомом, потому что паритет вендоров между EHR-системами неровный.

3. Какие специальности? Первичная помощь — вендоры сильны. Поведенческое здоровье — вендоры слабее, кастом окупается. Хирургия, OB-GYN, кардиология — зависит от вендора; пилотируйте на маленькой когорте, прежде чем брать на себя обязательства.

4. Где живёт аудио? Если ваши контракты запрещают аудио покидать ваш аккаунт в облаке или вашу страну — кастом единственный путь. Вендорские скрайбы обрабатывают аудио в облаке вендора; для части систем здравоохранения и большинства государственных заказчиков это deal-breaker.

5. Какова ваша AI-ops-ёмкость? Кастомному скрайбу нужна небольшая clinical-AI-команда. Если её нет и собрать не получается, партнёрство с разработчиком, у которого этот паттерн уже есть (мы — один из них), — путь безопаснее, чем собирать ин-хаус-команду с нуля и сжечь год.

Чего избегать

1. Оптимизировать WER вместо сэкономленных минут клинициста. Скрайб с WER 6 % и round-trip 30 секунд бьёт скрайб с WER 4 % и round-trip 4 минуты в любом опросе клиницистов. Оптимизируйте время до черновика, а не красоту транскрипта.

2. Пропустить аудит BAA. Считайте каждый внешний сервис в пайплайне (ASR, LLM, наблюдаемость, log-shipper, даже sentry-style крэш-репортер) касающимся PHI, пока не доказано обратное. Пройдите цепочку BAA от края до края до запуска.

3. Один гигантский промпт вместо многопроходного пайплайна. Скрайбы на одном промпте плывут, галлюцинируют и ломают форматирование секций. Генерируйте Subjective, Objective, Assessment, Plan и patient-summary как отдельные проходы со своим retrieval, своими промптами и своими бюджетами длины.

4. Забыть про штаты с двусторонним согласием. Выкатить одинаковый UX согласия пациента в Калифорнии и Техасе, потому что инженерно так проще, — быстрый способ получить иск в Калифорнии. Матрица согласий по штатам — с первого дня.

5. Считать запись в EHR пунктом из Phase 5. Если записи в EHR нет в MVP — продукт никогда не выйдет в прод, потому что клиницисты не примут ничего, что требует копипаста. Планируйте запись в EHR как Phase 1, а сужение скоупа — как Phase 5.

KPI, которые стоит мерить

KPI качества. Recall медицинских сущностей выше 96 % по специальности (препараты, дозы, анатомия, кандидаты ICD-10), соответствие форматированию секций выше 99 % (форма SOAP проходит lint-проверку), частота галлюцинаций ниже 0,4 % сгенерированных заметок, объём правок клинициста снижается от квартала к кварталу.

Бизнес-KPI. Сокращение «ночной» дописки карт больше 60 % на клинициста, время до черновика меньше 90 секунд от «остановил запись», NPS клиницистов выше +50 в первый месяц, принятие ИИ-кодирования выше 80 % без переделки кодировщиком, отток ниже 5 % за квартал.

KPI надёжности. Доступность пайплайна выше 99,95 % в часы работы клиники, p99 round-trip меньше 120 секунд, успешность записи в EHR выше 99,5 %, чистый аудит цепочки BAA каждый квартал, выполнение запросов на удаление меньше чем за 7 дней с момента запроса пациента.

FAQ

Abridge vs Suki vs Nuance DAX — что выбрать?

Если вы all-Epic-система первичной помощи и хотите самую глубокую нативную интеграцию — Abridge или DAX. Если у вас мультиспециальность и важен более агрессивный UX для клинициста — Suki. Если вы и так на Microsoft — DAX по умолчанию. Никто из них не закрывает строгую резидентность данных или нишевую специализацию; для этих случаев ответ — кастомное решение.

Подходит ли OpenAI Realtime API под HIPAA для амбиентного скрайба?

По состоянию на начало 2026 года аудиомодальность Realtime API ещё не покрыта большинством виденных нами BAA, даже у заказчиков, у которых есть BAA на стандартный текстовый эндпоинт. Уточните текущий текст BAA с вашим аккаунт-менеджером, прежде чем ставить продукт на Realtime audio в клинике. Безопаснее в 2026 году ставить на Anthropic Claude в AWS Bedrock или Azure OpenAI под их healthcare-BAA.

Сколько занимает разработка кастомного ИИ-скрайба?

Сфокусированный MVP с одной специальностью, одним целевым EHR и одним облачным LLM — 12–14 недель. Мультиспециальный, мультицелевой по EHR скрайб с полной HIPAA-программой и UX согласия пациента — 16–20 недель. Прибавьте 4–6 недель на любой кастомный файнтюнинг. HIPAA-программа безопасности идёт параллельным треком и сама по себе занимает 6–8 недель.

Нужен ли файнтюнинг или хватит RAG?

Для большинства сборок — нет. Сильный клинический индекс RAG (специализированные гайдлайны, шаблоны самого клинициста, карта пациента) плюс аккуратный prompt engineering на frontier-LLM (Claude, класс GPT-4, Gemini) даёт 90 % эффекта. Файнтюнинг окупается, когда у вас нишевые специализированные паттерны или строгий стиль-гайд клиники, который RAG надёжно не удерживает.

Может ли скрайб заменить человека-скрайба?

Да — для документирования; пока нет — для управления in-room workflow, которым занимаются опытные люди-скрайбы. Большинство операторов позиционируют ИИ-скрайб как инструмент для клинициста, чтобы уйти от домашней дописки карт, а не как замену человеку в каждом кабинете. Некоторые системы здравоохранения уже перепрофилируют людей-скрайбов в роли координаторов помощи.

А что с не-английскими визитами?

Многоязычный скрайб сложнее. Либо ведите визит с поддержкой переводчика (мы это делали на TransLinguist для NHS) и пишите английскую сторону, либо используйте многоязычный ASR (AWS Transcribe и Whisper-large-v3 хорошо работают на испанском; ниже уверенность на мандарине / вьетнамском / тагальском). Дообучение под специальность на не-английских языках разрежено; готовьтесь к большему объёму правок клинициста.

Как используются данные пациента для дообучения?

По умолчанию для любой ответственной сборки — никак. Аудио и транскрипты кормят пайплайн на каждый визит, а потом удаляются по контрактному графику хранения. Если переобучение — требование, оно живёт за явным opt-in пациента, полностью обезличено по методам HIPAA Safe Harbor или Expert Determination и зафиксировано в BAA. Большинство операторов в 2026 году вообще не дообучаются на пациентском аудио.

Когда ИИ-скрайб не подходит?

Стационарные больничные потоки, где заметки пишет ротирующая команда, потоки приёмного отделения, где форма визита слишком непредсказуема, и форензически-юридические потоки, где стандарт документирования не SOAP. В этих сценариях скрайб запускается как инструмент транскрипции, а слой структурированных заметок ждёт рефакторинга процесса.

Что почитать дальше

Смежная опорная статья

HIPAA и SOC 2 для телемедицинской видеоплатформы 2026

Каркас комплаенса, внутри которого живёт скрайб — BAA, шифрование, аудит-лог, пути удаления.

Опорная статья по телемедицине

Разработка телемедицинской платформы 2026

Полная поверхность телемедицинского продукта, в который встраиваются скрайбы — визиты, согласие, интеграция с EHR, биллинг.

Голосовые агенты

Производственный гайд по OpenAI Realtime API для голосового агента

Паттерны realtime-голосовой обвязки — что выпускаемо, на что смотреть, нюанс BAA для клинических применений.

Паттерны RAG

RAG поверх записей видео, аудио и чатов

Паттерны RAG, которые заземляют LLM-стадию скрайба — чанкинг, эмбеддинги, provenance.

LLM ops

Оценка LLM-приложения в продакшене

Как держать скрайб честным в продакшене — eval-наборы, регрессионные тесты, мониторинг галлюцинаций.

Готовы выпустить ИИ-скрайб клинического уровня?

ИИ-скрайб, который зарабатывает внедрение у клиницистов, — это семистадийный пайплайн, обёрнутый в HIPAA-программу, UX согласия пациента и интеграцию с EHR, доставляющую черновик заметки меньше чем за 90 секунд. Сделайте это правильно — и каждому клиницисту вернётся 60–120 минут в день. Самый чистый ROI в медицинском ИИ прямо сейчас.

Фора Софт выпустила эту поверхность внутри телемедицины в паттерне CirrusMED, поверх стека интерпретации NHS-уровня TransLinguist и как кастомную сборку для мультиспециализированного оператора. Паттерны, которые мы переиспользуем, — это те же паттерны. Если вы хотите, чтобы кастомный ИИ-скрайб был размечен, заскоплен и спланирован под вашу специальность, ваш состав EHR и правила резидентности данных, — у вас в почте будет 16-недельный план через 48 часов.

Пришлите бриф, получите 16-недельный план

Бесплатное 30-минутное обсуждение. Мы оценим объём работ, перечислим вендоров с BAA и пришлём план доставки с паттернами HIPAA уровня CirrusMED, которые мы уже эксплуатируем.

Позвоните нам → Напишите нам →

Технологии

Показатель	Цифра за 2025	Что это значит для вас
Выручка мобильных приложений с генеративным AI	225 млрд ₽, +273% год к году	Самостоятельное AI-приложение теперь полноценный продукт, а не просто функция.
Время в приложениях с генеративным AI	48 млрд часов (×3,6 к 2024)	Привычка у пользователей сформировалась — ассистенты теперь борются с вашим приложением за время сессии.
Внедрение разработчиками	63% выпускают ≥ 1 AI-функцию	Не выпускать AI в 2026 году — это уже конкурентное отставание, а не нейтральный выбор.
Прирост вовлечённости от персонализации	+62% вовлечённости, +80% конверсии	Одни только AI-рекомендации двигают финансовый результат.
Пользователи мобильных AI-ассистентов (США)	200 млн+ (110 млн только на мобильных)	Пользователи ждут, что голосовой и текстовый AI работает везде.
Прогноз Gartner	Использование мобильных приложений −25% к 2027 (из-за AI-ассистентов)	Приложения без встроенного AI будут терять сессии в пользу системных ассистентов.

Фреймворк / API	Платформа	Лучше всего для	Типичная задержка	Структура затрат
Core ML	iOS, macOS, watchOS	Зрение и NLP на устройстве с Apple Neural Engine	< 100 мс	Разовая, внутри приложения
Apple Foundation Models	iOS 18+, macOS 15+	LLM на устройстве, резюмирование, инструменты письма	< 500 мс	Бесплатно (в составе ОС)
TensorFlow Lite / LiteRT	Android, iOS, Web	Кроссплатформенное ML на устройстве	< 200 мс	Разовая, внутри приложения
MediaPipe	Android, iOS, Web	Поза, руки, лицо, жесты, сегментация	< 100 мс	Разовая, внутри приложения
ML Kit (Google)	Android, iOS	Распознавание текста, штрихкоды, перевод, обнаружение лиц	50 мс–2 с	Бесплатный тариф + за запрос
Gemini Nano (AICore)	Android (Pixel 9+, S26+)	LLM на устройстве, резюмирование, подсказки ответов	< 1 с	Бесплатно (в составе ОС)
ONNX Runtime Mobile	Android, iOS, Web	Переносимые модели между фреймворками	< 300 мс	Разовая, внутри приложения
OpenAI API (GPT-5)	Облако	Рассуждения, код и зрение уровня state-of-the-art	1–3 с	93,75–750 ₽ / 1 млн токенов
Anthropic Claude API	Облако	Рассуждения с длинным контекстом, анализ, код	1–3 с	75–1 875 ₽ / 1 млн токенов (−50% в батче)
Google Gemini API	Облако	Мультимодальность, экономичные текст и зрение	1–2 с	6–375 ₽ / 1 млн токенов
AWS Rekognition	Облако	Анализ изображений и видео, модерация	500 мс–2 с	0,075–0,9 ₽ / изображение
Azure Cognitive Services	Облако	Корпоративное зрение, речь, язык	500 мс–2 с	За запрос + подписка

Объём	Пример функции	Сроки	Ориентировочная стоимость
Одна функция на устройстве	Сканирование документа + OCR	4–8 недель	2–6 млн ₽
Гибрид среднего размера	Зрение на устройстве + облачный LLM-чат	8–14 недель	6–13,5 млн ₽
Полноценный гибрид под продакшн	Оркестрация нескольких моделей, RAG, мониторинг	14–22 недели	11,2–22,5 млн ₽
Корпоративная платформа	Регулируемая отрасль (здравоохранение / финтех), несколько регионов, SLA	22+ недели	от 22,5 млн ₽

Платформа	Для чего лучше всего	Стартовая цена	Нужна гарнитура?
ClassVR	Школа (K-12), более 1 500 сценариев под учебную программу	от 75 000 ₽ за школьный комплект	Да (гарнитуры в комплекте)
Labster	Лаборатории биологии, химии, физики в вузах	5 925–8 175 ₽ за студента в год	Нет (браузер + опционально VR)
Nearpod (с VR)	Встраивание в уроки в школе	11 925–29 775 ₽ в год на преподавателя	Опционально
zSpace	AR/VR без гарнитуры; более 3 500 округов	По запросу (фирменное оборудование)	Нет (очки + дисплей с трекингом)
Prisms VR	Математика и естественные науки, 140 округов	По запросу (лицензия округа)	Да
Engage / Spatial	Совместные классы в высшем образовании	37 500–150 000 ₽ в год за помещение	Да (несколько устройств)
CoSpaces Edu	VR-проекты, которые делают сами ученики	75–225 ₽ за ученика в год	Опционально
Osso VR / FundamentalVR	Хирургическая подготовка	450 000–3 млн ₽ в год за рабочее место	Да

Статья расходов	Год 1	Год 2 и далее
30 × Meta Quest 3S (комплект за 37 500 ₽)	1 125 000 ₽	0 ₽ (обновление раз в 3–4 года)
Контент-платформа (ClassVR / Nearpod)	150 000–375 000 ₽	150 000–375 000 ₽
Обучение преподавателей (1 день)	112 500–225 000 ₽	Обновление: 37 500 ₽/год
Зарядная станция + MDM	112 500–187 500 ₽	0 ₽
Страховка / поломки (10%)	112 500 ₽	112 500 ₽
Итого	1,6–2 млн ₽	300 000–525 000 ₽

Архитектура ИИ-скрайба в 2026: как построить production-систему амбиентного документирования

Почему Фора Софт написала этот плейбук

Почему ИИ-скрайб — главное killer-приложение медицинского ИИ в 2026

Что такое ИИ-скрайб на самом деле

Семистадийная референсная архитектура

Стадия 1 — Захват аудио и HIPAA-совместимая инфраструктура

Стадия 2 — Диаризация спикеров

Стадия 3 — ASR с медицинским контекстом

Стадия 4 — LLM с клиническим RAG

Стадия 5 — Генерация SOAP-заметки

Стадия 6 — Подсказка кодов CPT и ICD-10

Стадия 7 — Запись в EHR

Реальность HIPAA — аудиомодальность и цепочки BAA

Abridge vs Suki vs Nuance DAX vs кастомное решение

Дообучение под специальность — кардиология, дерматология, OB-GYN

Модель затрат — экономика на одного клинициста

Мини-кейс — слой скрайба в стиле CirrusMED

Фреймворк решения в пяти вопросах

Чего избегать

KPI, которые стоит мерить

FAQ

Что почитать дальше

Готовы выпустить ИИ-скрайб клинического уровня?

Похожие статьи

Хотите обсудить ваш проект?

Архитектура ИИ-скрайба в 2026: как построить production-систему амбиентного документирования

Почему Фора Софт написала этот плейбук

Почему ИИ-скрайб — главное killer-приложение медицинского ИИ в 2026

Что такое ИИ-скрайб на самом деле

Семистадийная референсная архитектура

Стадия 1 — Захват аудио и HIPAA-совместимая инфраструктура

Стадия 2 — Диаризация спикеров

Стадия 3 — ASR с медицинским контекстом

Стадия 4 — LLM с клиническим RAG

Стадия 5 — Генерация SOAP-заметки

Стадия 6 — Подсказка кодов CPT и ICD-10

Стадия 7 — Запись в EHR

Реальность HIPAA — аудиомодальность и цепочки BAA

Abridge vs Suki vs Nuance DAX vs кастомное решение

Дообучение под специальность — кардиология, дерматология, OB-GYN

Модель затрат — экономика на одного клинициста

Поток согласия пациента

Мини-кейс — слой скрайба в стиле CirrusMED

Фреймворк решения в пяти вопросах

Чего избегать

KPI, которые стоит мерить

FAQ

Что почитать дальше

Готовы выпустить ИИ-скрайб клинического уровня?

Похожие статьи

Хотите обсудить ваш проект?