
Главное
• ИИ-скрайб (AI scribe) — главное killer-приложение медицинского ИИ в 2026 году. Abridge привлёк 22 млрд ₽ в раунде Series D, Suki и Nuance DAX (Microsoft) масштабировались до десятков тысяч клиницистов, а амбиентное документирование — редкая категория ИИ, в которой ROI на пользователя окупается уже в первый месяц.
• Архитектура состоит из семи стадий, а не одной модели. Захват аудио → диаризация → медицинский ASR → LLM с клиническим RAG → генерация SOAP → подсказка кодов CPT/ICD-10 → запись в EHR. Пропустите любую стадию — и продукт провалится во внедрении.
• HIPAA — задача сложнее, чем сам ИИ. BAA на каждом узле, покрытие аудиомодальности у облачных LLM (OpenAI Realtime API в 2026 году ещё не покрыт большинством BAA — проверьте перед запуском), шифрование в транзите и в покое, неизменяемость аудит-логов и путь удаления, согласованный с правилом 6-летнего хранения.
• Три жизнеспособных экономических сценария. Купить Abridge / Suki / DAX (~15–30 тыс. ₽ на клинициста в месяц, быстрее всего к запуску, данные уходят вендору). Сделать white-label на партнёрской модели (~6–12 тыс. ₽ на клинициста в месяц, быстрый старт, меньше контроля). Сделать собственное решение (12–20 недель разработки, 30–105 млн ₽, ~1 875–4 500 ₽ на клинициста в месяц на эксплуатацию, полный контроль над данными и IP).
• Главная победа — это сэкономленное время, а не точность транскрипта. Полезный скрайб экономит клиницисту 60–120 минут в день на «ночной» дописке карт. Оптимизируйте round-trip от «остановил запись» до «черновик заметки готов в EHR» меньше чем за 90 секунд, а не десятые доли WER, за которыми вы привыкли гнаться.
Почему Фора Софт написала этот плейбук
Фора Софт уже два десятилетия выпускает HIPAA-совместимые телемедицинские и клинические платформы. Мы построили и продолжаем поддерживать CirrusMED — продукт первичной телемедицинской помощи в США, работающий под HIPAA-программой безопасности с BAA по всему стеку. Мы построили TransLinguist — платформу видеомедицинского перевода, законтрактованную в британский NHS, — и платформу телефонного больничного перевода для регулируемых трастов. Захват аудио в клинических условиях, цепочки BAA, границы шифрования в транзите, интеграция с EHR через FHIR и UX-согласие, удерживающие продукт в рамках комплаенса, — это всё области, в которых мы уже выпускали продукты.
В 2025–2026 годах мы провели технический due diligence двух AI-scribe-стартапов на стадии pre-Series-A и выпустили расширение для амбиентного документирования поверх существующего телемедицинского продукта. Шаблоны в этом руководстве — из тех проектов плюс из публичных источников: продуктовых раскрытий Abridge, Suki и Nuance DAX, документации OpenAI Realtime API и их BAA-позиции, технического брифа AWS HealthScribe и рекомендаций AMA / AMIA по применению ИИ в клиническом документировании.
Если вы основатель телемедицинского сервиса, добавляющего амбиентное документирование, CIO больницы, оценивающий Abridge / Suki / DAX, AI-product-стартап в здравоохранении, выбирающий между сборкой и партнёрством, или вендор EHR, исследующий встроенный скрайб, — это руководство даёт вам архитектуру, реальность HIPAA, расчёты на одного клинициста и план запуска на 16–20 недель, который мы используем с собственными клиентами.
Строите кастомный ИИ-скрайб под конкретную специальность?
Бесплатное 30-минутное скоупинг-обсуждение. Мы оценим объём работ, перечислим вендоров с BAA, набросаем план на 16 недель и принесём паттерны HIPAA в стиле CirrusMED, которые мы уже эксплуатируем.
Почему ИИ-скрайб — главное killer-приложение медицинского ИИ в 2026
У медицинского ИИ было шумное десятилетие пилотов, которые так и не закрепились. В 2024–2025 годах амбиентное документирование сломало этот шаблон, потому что ROI здесь необычно прозрачный: клиницист тратит 1–2 часа каждый вечер на «ночную» дописку карт после последнего пациента. Рабочий скрайб возвращает это время. Net Promoter Score у клиницистов, использующих Abridge, Suki или DAX, держится в диапазоне +60…+80 — редкость для любого корпоративного ПО, не говоря уже про здравоохранение.
Категорию вытолкнули в центр три структурных сдвига. Первый — LLM класса GPT в 2023–2024 годах сделали медицинскую суммаризацию достаточно надёжной для черновика заметки. Второй — вендоры EHR (Epic, Oracle Health, athenahealth) построили дружелюбные к скрайбам API записи, потому что этого потребовали системы здравоохранения. Третий — плательщики и CMS негласно приняли заметки, сгенерированные ИИ, как документацию официального уровня, при условии что клиницист их проверяет и подписывает.
Реакция рынка получилась агрессивной. Abridge — 22 млрд ₽ в Series D в 2024 году. Suki и DAX (Microsoft) масштабировались в тысячи систем здравоохранения. Heidi, Augmedix, Doximity, Nabla, Freed, ScribeAmerica — все выпускают свои варианты продукта. Поэтому в 2026 году вопрос «строить или купить» актуален для каждого CIO системы здравоохранения, каждого основателя телемедицинского сервиса и каждого вендора EHR.
Что такое ИИ-скрайб на самом деле
ИИ-скрайб — это не инструмент транскрипции. Это сквозной пайплайн, который берёт разговор клинициста с пациентом — в кабинете или по телемедицине — и формирует структурированную клиническую заметку (обычно SOAP — Subjective, Objective, Assessment, Plan), а также подсказывает биллинговые коды и записывает результат в EHR на проверку и подпись клиницистом.
1. Это амбиентный продукт. Клиницист не диктует. Микрофон работает фоном на протяжении всего приёма. Захватываются оба собеседника. Модель должна извлечь клинические факты из разговора, а не из структурированной диктовки.
2. Это структурированный вывод. На выходе не абзац транскрипта. Это SOAP-заметка в той форме, в которой реально читается медицинская карта: Chief Complaint, History of Present Illness, Review of Systems, Physical Exam, Assessment, Plan плюс инструкции пациенту. У каждой секции — свой целевой стиль и длина.
3. Это продукт, понимающий биллинг. Ценный скрайб также подсказывает коды CPT и ICD-10 из контекста разговора (а не просто по поиску ключевых слов). Клиницист проверяет подсказки; revenue cycle отыгрывает обратно время и точность.
4. Это интегрированный продукт. Клиницист не должен ничего копипастить. Заметка возвращается в Epic / Cerner / athena / кастомный EHR через FHIR, HL7v2 или вендорский API записи. Без интеграции продукт превращается в гимик для повышения продуктивности.
5. Это HIPAA-grade-продукт. Аудио — это PHI с момента захвата. Пайплайн живёт внутри цепочки BAA, шифрует в транзите и в покое, удерживает аудит-логи и поддерживает согласие пациента и его отзыв.
Семистадийная референсная архитектура
Каждый выпущенный в 2026 году скрайб — Abridge, Suki, DAX, Heidi, Nabla, AWS HealthScribe, наши кастомные сборки — сводится к одному и тому же семистадийному пайплайну. Реализации, вендорские вызовы и место оркестрации различаются. Форма — нет.
Следующие разделы разбирают каждую стадию. Они идут в том порядке, в котором аудио реально движется — от захвата до записи в EHR, — чтобы решения по каждой стадии оседали в контексте того, что им предшествует и что за ними следует.
Стадия 1 — Захват аудио и HIPAA-совместимая инфраструктура
Захват аудио — точка, где начинается история HIPAA. Две поверхности: очные приёмы (приложение для iOS / Android, десктопный helper, USB-микрофон с beamforming) и телемедицинские приёмы (хук в WebRTC-поток). Для очных приёмов предпочтительнее микрофон с beamforming (например, серия Shure MXA или USB-микрофон за 2 250 ₽ от поставщика клинического оборудования) — он подавляет второй голос, шум вентиляции и стук по клавиатуре. Для телемедицины захватывайте аудио со стороны ингеста — после эхоподавления, но до сведения.
Кодек и частота дискретизации важны для нижестоящего ASR. 16 кГц моно PCM (или 16 кГц Opus на 32–64 кбит/с) — золотая середина. Ниже 16 кГц начинает страдать ASR на медицинских терминах; выше — это просто потраченная полоса пропускания на телефонных микрофонах.
Инфраструктура должна быть HIPAA-совместимой от края до края. Используйте регион AWS / GCP / Azure, в котором у вендора есть HIPAA-совместимый BAA. Шифруйте аудио в покое ключами KMS под управлением провайдера. Шифруйте в транзите по TLS 1.2 или выше. Сырое аудио храните только пока оно нужно (большинство операторов удаляет его в течение 30 дней; некоторые хранят дольше для дообучения по явному согласию пациента). Аудио — это PHI; относитесь к bucket / topic / queue как к носителю PHI целиком.
Берите микрофон с beamforming, когда: доминируют очные приёмы, кабинеты шумные или клиницист перемещается по кабинету во время визита. Только-телемедицинские сценарии могут пропустить этот шаг полностью.
Стадия 2 — Диаризация спикеров
Диаризация отвечает на вопрос «кто что и когда сказал». В большинстве случаев спикеров двое (клиницист и пациент), но в реальных приёмах участвуют родственники, опекуны, переводчики и медицинский ассистент. Готовые инструменты — pyannote.audio (золотой стандарт офлайн-диаризации), встроенная диаризация AWS Transcribe Medical, NVIDIA NeMo и API диаризации AssemblyAI.
Полезный паттерн — диаризовать дважды. Онлайн, в реальном времени, быстрой моделью (точность ниже, нужна для живого UI, показывающего, кто сейчас говорит). Офлайн, после визита, pyannote или NeMo на полном аудио (точность выше, идёт в LLM). Стоимость двойного прохода невелика, а точность офлайн-прохода влияет на качество заметки сильнее, чем шаг ASR.
Берите офлайн-передиаризацию, когда: качество заметки важнее задержки UI, в визите больше двух спикеров или правки клиницистов после визита кучкуются вокруг неверной атрибуции спикеров.
Стадия 3 — ASR с медицинским контекстом
Медицинский ASR — место, где универсальные транскрипционные инструменты ломаются. Названия препаратов, дозировки, анатомия, аббревиатуры, лабораторные значения и термины процедур — это длинный хвост словаря, по которому коробочный ASR будет угадывать. Жизнеспособные варианты в 2026 году: AWS Transcribe Medical, Microsoft Azure Healthcare Speech, медицинская модель AssemblyAI, Deepgram Nova-2 medical, NVIDIA Parakeet-MED и self-hosted Whisper с клиническим лексиконом и доменно-настроенным beam-search-рескорером.
Word error rate — неправильный KPI для медицинского ASR в одиночку. Правильный KPI — recall медицинских сущностей: поймал ли ASR название препарата, дозу, путь введения, частоту? Поймал ли термин анатомии и название процедуры? Записал ли правильное состояние с кодом ICD-10? Соберите hold-out-набор из 200–500 сегментов визита и измеряйте recall сущностей по каждой специальности.
Растущий паттерн — кормить LLM сырой транскрипт ASR вместе с эмбеддингом аудио (или низкобитным представлением аудио). LLM может поправить ошибки ASR, используя контекст, до которого текстовый постпроцессинг не достанет. Этот паттерн используют AWS HealthScribe и часть кастомных сборок; в наших тестах он поднимает recall сущностей на 4–8 процентных пунктов.
Берите self-hosted Whisper, когда: резидентность данных не обсуждается, нужен полный контроль над артефактом модели или покрытие BAA вендора в нужном облачном регионе неполное.
Стадия 4 — LLM с клиническим RAG
LLM — мозг скрайба. Она берёт диаризованный, прошедший ASR транскрипт и формирует шаги клинического рассуждения, которые превращают разговор в структурированную заметку. Жизнеспособные субстраты LLM в 2026 году (под BAA): Anthropic Claude в AWS Bedrock в HIPAA-совместимом регионе, модели класса GPT-4 в Azure OpenAI под healthcare-BAA Microsoft, Google Gemini в Vertex AI в HIPAA-совместимом регионе и self-hosted-модели на открытых весах (Llama-3-класса, Mistral, производные MedAlpaca) для заказчиков со строгой резидентностью.
Клинический RAG — отличающий фактор, который превращает универсальный суммаризатор в полезный скрайб. Заземляйте каждую генерацию заметки на: предыдущую карту пациента (problem list, аллергии, лекарства, прежние заметки), предпочтительные шаблоны клинициста (заметка-наблюдение в дерматологии и приём в OB-GYN выглядят очень по-разному), релевантные клинические гайдлайны для основной жалобы и формуляр практики. RAG поверх записей видео, аудио и чатов имеет ту же форму; клинический RAG просто строже относится к provenance.
Стадия 5 — Генерация SOAP-заметки
Формат SOAP — Subjective, Objective, Assessment, Plan — это канонический способ структурировать клиническую заметку в амбулаторной практике в США. У каждой секции свои ограничения. Subjective — краткая проза («пациент сообщает…»). Objective — плотные булиты с физикальными находками. Assessment — нумерованный дифференциальный диагноз. Plan — нумерованный список действий с медикаментами, дозировками, follow-up и образованием пациента.
Генерируйте четыре секции четырьмя проходами LLM, а не одним гигантским промптом. У каждого прохода — свой системный промпт, свой набор retrieval и свой бюджет длины. Этот паттерн снижает галлюцинации, делает регрессионное тестирование посекционно отслеживаемым и позволяет клиницисту править одну секцию, не ломая другую. Мы также делаем отдельный проход «patient-facing summary» для раздаточных материалов с резюме визита.
Берите четырёхпроходный паттерн SOAP, когда: галлюцинации в одно-промптной базовой реализации превышают 1 %, правки клинициста кучкуются в одной секции (обычно Plan) или специализированные шаблоны требуют строгого посекционного форматирования.
Стадия 6 — Подсказка кодов CPT и ICD-10
Кодирование — место, где скрайб зарабатывает второй кусок ROI. Подсказывайте коды CPT (процедура / уровень визита E&M) и ICD-10 (диагноз) по контексту визита. Не выставляйте счета автоматически: клиницист или кодировщик проверяет и подписывает. Команды revenue cycle в больницах принимают кодирование с подсказкой ИИ только тогда, когда оно сопровождается оценкой уверенности и цитатой обратно к фрагменту разговора, который оправдывает код.
Соберите кодировщик как шаг LLM, который берёт SOAP-заметку плюс диаризованный транскрипт и выдаёт список кортежей (код, обоснование, фрагмент, уверенность). Закэшируйте справочники AMA CPT и CMS ICD-10 в индексе RAG. Перезапускайте кодировщик при каждой правке заметки, чтобы подсказанные коды отслеживали правки клинициста.
Стадия 7 — Запись в EHR
Запись в EHR — интеграция, которая выигрывает или проигрывает внедрение. Три полосы. 1. Запись через FHIR (Epic, Oracle Health/Cerner, athenahealth — все экспонируют ресурсы FHIR R4 DocumentReference и Encounter для записи заметок, всё чаще без отдельного интеграционного проекта на заказчика). 2. HL7v2 (легаси-системы по-прежнему опираются на сообщения ORU и MDM поверх MLLP). 3. Вендорские REST (Epic App Orchard / Showroom, Oracle Health Code Console, маркетплейс API athenahealth) — глубже хуки, но больше работы под каждого вендора.
Планируйте round-trip записи меньше 90 секунд — от «остановил запись» до «черновик заметки в worklist EHR». Медленнее — и клиницист перезапустит EHR вместо того, чтобы ждать. Прокэшируйте контекст пациента заранее (problem list, лекарства, аллергии, недавние визиты), чтобы стадия LLM стартовала в момент остановки записи.
Реальность HIPAA — аудиомодальность и цепочки BAA
Каждый внешний сервис, который касается аудио или транскрипта, должен находиться под Business Associate Agreement (BAA). Цепочка ломается на самом слабом звене. Ландшафт 2026 года в основном кооперативный: AWS, GCP, Azure, AssemblyAI, Deepgram, AWS HealthScribe, Anthropic в Bedrock, Microsoft Azure OpenAI — все подписывают BAA. Исключения, которые стоит проверять: аудиомодальность OpenAI Realtime API в 2026 году ещё не покрыта большинством виденных нами BAA (компания движется в эту сторону; уточните текущий текст BAA, прежде чем ставить продукт на Realtime audio в клинике). Прямые потребительские голосовые сервисы (ElevenLabs, публичные эндпоинты Whisper API), как правило, BAA не покрыты.
Неизменяемость аудит-лога имеет значение. Append-only-логи (CloudTrail с S3 Object Lock, Azure Monitor в неизменяемом режиме, Google Cloud Audit Logs в compliance-режиме) — это операционный ответ. Храните логи как минимум 6 лет, чтобы попасть в правило хранения HIPAA.
Удаление пациента — нетривиальная задача. Отзыв согласия пациентом должен запускать удаление аудио, транскрипта и любых артефактов обучения модели, при этом сохраняя клиническую заметку, которую клиницист подписал (заметка — это медицинская запись и регулируется законом штата о хранении, обычно 6–10 лет). Стройте граф данных так, чтобы аудио ↔ транскрипт ↔ подсказанные коды ↔ подписанная заметка были индивидуально адресуемы для удаления.
Abridge vs Suki vs Nuance DAX vs кастомное решение
Большинство сравнений сводится к четырёхстороннему. Ответ зависит от контроля данных, глубины интеграции с EHR, попадания по специальности и бюджета. Цены и фичи смещаются от квартала к кварталу; таблица ниже — снапшот по публичным материалам и разговорам с операторами на начало 2026 года.
| Вариант | Ценовой диапазон | Интеграция с EHR | Контроль данных | Специализации |
|---|---|---|---|---|
| Abridge | ~15–30 тыс. ₽ / клиницист / мес. | Глубокая Epic, Oracle, athena | Хостится у вендора | Сильны в первичной помощи, расширяют спектр |
| Suki | ~11–22 тыс. ₽ / клиницист / мес. | Epic, athena, eClinicalWorks | Хостится у вендора | Мультиспециальность, сильны в кардио / орто |
| Nuance DAX (Microsoft) | ~22–45 тыс. ₽ / клиницист / мес. | Нативная Epic, Cerner / Oracle | Хостится у Microsoft | Широкий спектр, уклон в энтерпрайз |
| AWS HealthScribe | По потреблению, ~7–22 ₽ / минута | DIY (собираете сами) | Ваш аккаунт AWS | Универсальный, специализацию настраиваете сами |
| Кастомная сборка (паттерн Фора Софт) | ~1 875–4 500 ₽ / клиницист / мес. эксплуатации + 30–105 млн ₽ на разработку | Ваш стек, ваши приоритеты | Ваше облако, ваши BAA | Любая, под которую вы дообучаетесь |
Два вывода. Первый: цена вендорских скрайбов на одного клинициста экономически имеет смысл для больниц со стабильным операционным бюджетом и неэкономична для телемедицинских платформ, которые платят эту сумму за каждого клинициста в своей сети. Второй: кастомная сборка окупается, когда у вас есть либо (а) больше ~600 клиницистов, либо (б) сильная специализация, которую вендоры не покрывают, либо (в) строгое требование к резидентности данных.
Дообучение под специальность — кардиология, дерматология, OB-GYN
Универсальный скрайб уверенно справляется с заметками в стиле первичной помощи. У специальностей свои словари, структуры и паттерны кодирования. Кардиологические заметки сильно опираются на результаты стресс-тестов, находки ЭКГ, фракцию выброса и терминологию кардиопроцедур. Дерматология живёт описаниями элементов, планами биопсии и ограниченным набором CPT-кодов (серия 17000). OB-GYN включает акушерский анамнез (нотация G/P), результаты УЗИ и быстро меняющийся пост-Dobbs правовой контекст, влияющий на клиническое документирование.
Прагматичное дообучение под специальность — это два прохода. Первый — доменно-специфический индекс RAG (корпус специализированных гайдлайнов, заметки той же специальности с кодами, специализированные шаблоны). Второй — небольшой SFT на нескольких тысячах заметок, отредактированных клиницистами в этой специальности. Полный LoRA / полный файнтюнинг базовой LLM редко требуется и редко окупается; путь «RAG плюс шаблоны» даёт большую часть прироста.
Модель затрат — экономика на одного клинициста
У кастомного скрайба три статьи затрат: разработка, эксплуатация и операции. Разработка — 16–20-недельный инженерный цикл: 30–105 млн ₽ в зависимости от количества специальностей, глубины EHR и от того, начинаете ли вы с готовой части пайплайна. Эксплуатация — стоимость инфраструктуры на визит: ASR ~3 ₽/мин, токены LLM ~3–7,5 ₽/заметка, инфраструктура и наблюдаемость ~1,5 ₽/визит, амортизация коннектора EHR. Типичный день клинициста на 18 визитов стоит около 67–135 ₽ в сырой инфре; округляя на пятидневную неделю и 48 рабочих недель — около 1 875–4 500 ₽ на клинициста в месяц.
Операции — это человеческая стоимость поддержания модели в форме: небольшая команда clinical-AI, которая разбирает крайние случаи, переобучает модули по специальностям, мониторит частоту галлюцинаций и принимает решения по запросам пациентов на удаление. Закладывайте одного клинического инженера на 2 000 клиницистов в стационарном режиме и part-time-клинического ревьюера с медицинским образованием.
Системам здравоохранения, сравнивающим цену на покупку Abridge (15–30 тыс. ₽ / клиницист / мес.) и all-in-стоимость кастомной сборки (3 375–6 000 ₽ / клиницист / мес. на масштабе), точка безубыточности — около отметки в 600 клиницистов. Меньше — покупайте. Больше — обычно выигрывает кастомная сборка, особенно когда вы добавляете опасения насчёт контроля данных у вендора и выгодные условия, которые можно выторговать на общей инфраструктуре.
Поток согласия пациента
Согласие пациента — поверхность, которую пациент видит и которую регулятор измеряет. Постройте понятный UX, в котором пациенту сообщается: (а) что записывается, (б) как это используется, (в) у кого есть доступ, (г) как долго это хранится и (д) как пациент может отозвать согласие. Формулировки должны быть короткими и простыми («Этот визит записывается, чтобы клиницист мог уделить вам больше времени»); юридическая обвязка живёт в политике конфиденциальности и BAA, а не в UI согласия.
В штатах с правилом одностороннего согласия (большинство штатов США) юридически требуется только согласие со стороны клинициста, но любой серьёзный скрайб всё равно спрашивает у пациента, потому что внедрение зависит от его комфорта. В штатах с двусторонним согласием (Калифорния, Флорида, Иллинойс, Мэриленд, Массачусетс, Монтана, Невада, Нью-Гэмпшир, Пенсильвания, Вашингтон по состоянию на 2025 год) явный opt-in пациента обязателен; не запускайтесь без него.
Мини-кейс — слой скрайба в стиле CirrusMED
Телемедицинский оператор, использующий инфраструктуру в паттерне CirrusMED, попросил нас добавить амбиентный скрайб поверх существующего продукта видеовизитов. У них работало около 220 клиницистов в первичной помощи и поведенческом здоровье, интеграция с athenahealth и кастомным внутренним EHR, и они хотели держать аудио в собственном аккаунте AWS.
Мы выпустили решение за 17 недель. Стек: AWS Transcribe Medical для ASR, pyannote.audio для офлайн-передиаризации, Anthropic Claude в Bedrock для четырёхпроходной генерации SOAP и подсказчика CPT / ICD-10, индекс RAG в OpenSearch с прежней картой, problem list и шаблонами клиницистов, запись через FHIR DocumentReference в athena и кастомный путь HL7v2 во внутренний EHR. Согласие пациента добавлено как в предвизитный поток пациента, так и на in-visit-экран.
По итогам первого квартала: средняя «ночная» дописка карт упала с 1 ч 48 мин до 22 мин на клинициста в день, NPS клиницистов по скрайбу — +71, объём правок заметок снижался от недели к неделе по мере приземления специализированных дообучений, а revenue-cycle-команда оператора принимала подсказанное ИИ кодирование в 84 % визитов без переделки кодировщиком. Хотите похожий проект? Позвоните или напишите нам.
Нужен HIPAA-совместимый ИИ-скрайб за 16 недель?
Бесплатное 30-минутное скоупинг-обсуждение. Мы вернёмся со списком вендоров с BAA, постадийной архитектурой, моделью затрат на одного клинициста и планом доставки.
Фреймворк решения в пяти вопросах
Пройдите пять вопросов ниже, прежде чем выбрать «строить», «купить» или «партнёриться». Ответы определят, какая полоса вам подходит.
1. Сколько клиницистов? Меньше ~250 — покупайте Abridge или Suki и запускайтесь за недели. От 250 до 600 — оценивайте AWS HealthScribe плюс тонкий кастомный слой или партнёрскую модель. Больше 600 — кастомная сборка обычно выигрывает по 24-месячному TCO.
2. Какой состав EHR? Все-Epic-площадки могут позволить себе самого глубоко интегрированного вендора (Abridge или DAX). Гетерогенный состав EHR двигает в сторону кастомной сборки или связки HealthScribe с кастомом, потому что паритет вендоров между EHR-системами неровный.
3. Какие специальности? Первичная помощь — вендоры сильны. Поведенческое здоровье — вендоры слабее, кастом окупается. Хирургия, OB-GYN, кардиология — зависит от вендора; пилотируйте на маленькой когорте, прежде чем брать на себя обязательства.
4. Где живёт аудио? Если ваши контракты запрещают аудио покидать ваш аккаунт в облаке или вашу страну — кастом единственный путь. Вендорские скрайбы обрабатывают аудио в облаке вендора; для части систем здравоохранения и большинства государственных заказчиков это deal-breaker.
5. Какова ваша AI-ops-ёмкость? Кастомному скрайбу нужна небольшая clinical-AI-команда. Если её нет и собрать не получается, партнёрство с разработчиком, у которого этот паттерн уже есть (мы — один из них), — путь безопаснее, чем собирать ин-хаус-команду с нуля и сжечь год.
Чего избегать
1. Оптимизировать WER вместо сэкономленных минут клинициста. Скрайб с WER 6 % и round-trip 30 секунд бьёт скрайб с WER 4 % и round-trip 4 минуты в любом опросе клиницистов. Оптимизируйте время до черновика, а не красоту транскрипта.
2. Пропустить аудит BAA. Считайте каждый внешний сервис в пайплайне (ASR, LLM, наблюдаемость, log-shipper, даже sentry-style крэш-репортер) касающимся PHI, пока не доказано обратное. Пройдите цепочку BAA от края до края до запуска.
3. Один гигантский промпт вместо многопроходного пайплайна. Скрайбы на одном промпте плывут, галлюцинируют и ломают форматирование секций. Генерируйте Subjective, Objective, Assessment, Plan и patient-summary как отдельные проходы со своим retrieval, своими промптами и своими бюджетами длины.
4. Забыть про штаты с двусторонним согласием. Выкатить одинаковый UX согласия пациента в Калифорнии и Техасе, потому что инженерно так проще, — быстрый способ получить иск в Калифорнии. Матрица согласий по штатам — с первого дня.
5. Считать запись в EHR пунктом из Phase 5. Если записи в EHR нет в MVP — продукт никогда не выйдет в прод, потому что клиницисты не примут ничего, что требует копипаста. Планируйте запись в EHR как Phase 1, а сужение скоупа — как Phase 5.
KPI, которые стоит мерить
KPI качества. Recall медицинских сущностей выше 96 % по специальности (препараты, дозы, анатомия, кандидаты ICD-10), соответствие форматированию секций выше 99 % (форма SOAP проходит lint-проверку), частота галлюцинаций ниже 0,4 % сгенерированных заметок, объём правок клинициста снижается от квартала к кварталу.
Бизнес-KPI. Сокращение «ночной» дописки карт больше 60 % на клинициста, время до черновика меньше 90 секунд от «остановил запись», NPS клиницистов выше +50 в первый месяц, принятие ИИ-кодирования выше 80 % без переделки кодировщиком, отток ниже 5 % за квартал.
KPI надёжности. Доступность пайплайна выше 99,95 % в часы работы клиники, p99 round-trip меньше 120 секунд, успешность записи в EHR выше 99,5 %, чистый аудит цепочки BAA каждый квартал, выполнение запросов на удаление меньше чем за 7 дней с момента запроса пациента.
FAQ
Abridge vs Suki vs Nuance DAX — что выбрать?
Если вы all-Epic-система первичной помощи и хотите самую глубокую нативную интеграцию — Abridge или DAX. Если у вас мультиспециальность и важен более агрессивный UX для клинициста — Suki. Если вы и так на Microsoft — DAX по умолчанию. Никто из них не закрывает строгую резидентность данных или нишевую специализацию; для этих случаев ответ — кастомное решение.
Подходит ли OpenAI Realtime API под HIPAA для амбиентного скрайба?
По состоянию на начало 2026 года аудиомодальность Realtime API ещё не покрыта большинством виденных нами BAA, даже у заказчиков, у которых есть BAA на стандартный текстовый эндпоинт. Уточните текущий текст BAA с вашим аккаунт-менеджером, прежде чем ставить продукт на Realtime audio в клинике. Безопаснее в 2026 году ставить на Anthropic Claude в AWS Bedrock или Azure OpenAI под их healthcare-BAA.
Сколько занимает разработка кастомного ИИ-скрайба?
Сфокусированный MVP с одной специальностью, одним целевым EHR и одним облачным LLM — 12–14 недель. Мультиспециальный, мультицелевой по EHR скрайб с полной HIPAA-программой и UX согласия пациента — 16–20 недель. Прибавьте 4–6 недель на любой кастомный файнтюнинг. HIPAA-программа безопасности идёт параллельным треком и сама по себе занимает 6–8 недель.
Нужен ли файнтюнинг или хватит RAG?
Для большинства сборок — нет. Сильный клинический индекс RAG (специализированные гайдлайны, шаблоны самого клинициста, карта пациента) плюс аккуратный prompt engineering на frontier-LLM (Claude, класс GPT-4, Gemini) даёт 90 % эффекта. Файнтюнинг окупается, когда у вас нишевые специализированные паттерны или строгий стиль-гайд клиники, который RAG надёжно не удерживает.
Может ли скрайб заменить человека-скрайба?
Да — для документирования; пока нет — для управления in-room workflow, которым занимаются опытные люди-скрайбы. Большинство операторов позиционируют ИИ-скрайб как инструмент для клинициста, чтобы уйти от домашней дописки карт, а не как замену человеку в каждом кабинете. Некоторые системы здравоохранения уже перепрофилируют людей-скрайбов в роли координаторов помощи.
А что с не-английскими визитами?
Многоязычный скрайб сложнее. Либо ведите визит с поддержкой переводчика (мы это делали на TransLinguist для NHS) и пишите английскую сторону, либо используйте многоязычный ASR (AWS Transcribe и Whisper-large-v3 хорошо работают на испанском; ниже уверенность на мандарине / вьетнамском / тагальском). Дообучение под специальность на не-английских языках разрежено; готовьтесь к большему объёму правок клинициста.
Как используются данные пациента для дообучения?
По умолчанию для любой ответственной сборки — никак. Аудио и транскрипты кормят пайплайн на каждый визит, а потом удаляются по контрактному графику хранения. Если переобучение — требование, оно живёт за явным opt-in пациента, полностью обезличено по методам HIPAA Safe Harbor или Expert Determination и зафиксировано в BAA. Большинство операторов в 2026 году вообще не дообучаются на пациентском аудио.
Когда ИИ-скрайб не подходит?
Стационарные больничные потоки, где заметки пишет ротирующая команда, потоки приёмного отделения, где форма визита слишком непредсказуема, и форензически-юридические потоки, где стандарт документирования не SOAP. В этих сценариях скрайб запускается как инструмент транскрипции, а слой структурированных заметок ждёт рефакторинга процесса.
Что почитать дальше
Смежная опорная статья
HIPAA и SOC 2 для телемедицинской видеоплатформы 2026
Каркас комплаенса, внутри которого живёт скрайб — BAA, шифрование, аудит-лог, пути удаления.
Опорная статья по телемедицине
Разработка телемедицинской платформы 2026
Полная поверхность телемедицинского продукта, в который встраиваются скрайбы — визиты, согласие, интеграция с EHR, биллинг.
Голосовые агенты
Производственный гайд по OpenAI Realtime API для голосового агента
Паттерны realtime-голосовой обвязки — что выпускаемо, на что смотреть, нюанс BAA для клинических применений.
Паттерны RAG
RAG поверх записей видео, аудио и чатов
Паттерны RAG, которые заземляют LLM-стадию скрайба — чанкинг, эмбеддинги, provenance.
LLM ops
Оценка LLM-приложения в продакшене
Как держать скрайб честным в продакшене — eval-наборы, регрессионные тесты, мониторинг галлюцинаций.
Готовы выпустить ИИ-скрайб клинического уровня?
ИИ-скрайб, который зарабатывает внедрение у клиницистов, — это семистадийный пайплайн, обёрнутый в HIPAA-программу, UX согласия пациента и интеграцию с EHR, доставляющую черновик заметки меньше чем за 90 секунд. Сделайте это правильно — и каждому клиницисту вернётся 60–120 минут в день. Самый чистый ROI в медицинском ИИ прямо сейчас.
Фора Софт выпустила эту поверхность внутри телемедицины в паттерне CirrusMED, поверх стека интерпретации NHS-уровня TransLinguist и как кастомную сборку для мультиспециализированного оператора. Паттерны, которые мы переиспользуем, — это те же паттерны. Если вы хотите, чтобы кастомный ИИ-скрайб был размечен, заскоплен и спланирован под вашу специальность, ваш состав EHR и правила резидентности данных, — у вас в почте будет 16-недельный план через 48 часов.
Пришлите бриф, получите 16-недельный план
Бесплатное 30-минутное обсуждение. Мы оценим объём работ, перечислим вендоров с BAA и пришлём план доставки с паттернами HIPAA уровня CirrusMED, которые мы уже эксплуатируем.

