Ключевые тезисы

Большинство ИИ-репетиторов умирают через 2 недели, потому что это чат-боты, а не репетиторы. Настоящему ИИ-репетитору нужны пять столпов: RAG, привязанный к учебной программе, модель усвоения, явная педагогическая стратегия, диалоговый слой и движок вовлечения. Уберите хотя бы один — и эффект новизны схлопнется.

ИИ-репетитор — это не ChatGPT с системным промптом. ChatGPT решает задачи за ученика. Репетитор отказывается их решать, задаёт сократические вопросы, знает, что ученик уже усвоил, и подбирает сложность по каждой теме. Другая целевая функция — другая архитектура.

Усвоение важнее метрик вовлечения. Время в приложении — пустая цифра для репетитора: ученики, проводящие в нём по 10 часов в неделю и ничему не научившиеся, — это провал. Считайте усвоенные темы в час и рост по бенчмарку, а не длину сессии.

Приватность — это шлюз EU AI Act. ИИ, используемый при поступлении, оценивании или в определении доступа к образованию, относится к высокорисковым по Приложению III. Плюс COPPA для пользователей младше 13 лет в США, FERPA для учебных записей, GDPR для ЕС. Ничто из этого в 2026 году не опционально.

MVP вертикального ИИ-репетитора запускается за 16 недель за 13–24 млн ₽. Загрузка учебной программы, модель усвоения, сократический диалоговый слой, мобильное и веб-приложение. Вертикальная специализация (подготовка к медицинским экзаменам, школьная математика, изучение языков, кодинг) — это и есть ров: горизонтальные универсальные ИИ-репетиторы конкурируют с Khanmigo и проигрывают.

Зачем Фора Софт написала этот гайд

Фора Софт делает обучающие системы на ИИ ещё с тех времён, когда «ИИ-репетитор» означал интеллектуальную обучающую систему на правилах. Наш флагман — BrainCert: 750 млн ₽ годовой выручки, более 250 000 учеников, отслеживание усвоения и адаптивные траектории, встроенные в LMS. Также мы построили Quillionz — продукт для генерации учебных вопросов на ИИ, который первым научился создавать вопросы с привязкой к учебной программе, плюс Scholarly и Polymath AI в нише ИИ-репетиторов.

В 2024–2026 годах мы провели аудит четырёх ИИ-репетиторов на стадии pre-seed и seed. У трёх из четырёх повторялся один и тот же паттерн провала: тонкая обёртка LLM поверх учебной программы, отсутствие модели усвоения, отсутствие педагогической стратегии, удержание на 30-й день меньше 12 %. Паттерны в этом гайде взяты из тех проектов плюс из открытых источников: исследований Khanmigo от Khan Academy, развёртываний ChatGPT-Edu у OpenAI, статей про адаптивное обучение от Squirrel AI, литературы про Bayesian Knowledge Tracing из Carnegie Mellon и классификации высокого риска по Приложению III EU AI Act.

Если вы продакт-менеджер EdTech-продукта, прикручивающий ИИ-репетитора к существующей платформе, корпоративный руководитель L&D, выбирающий вендора адаптивного обучения, или фаундер репетиторской компании, который строит всё с нуля, — этот гайд даст вам архитектуру, выбор алгоритмов, реальную картину по приватности и тот самый план запуска за 16 недель, который мы используем со своими клиентами.

Строите вертикального ИИ-репетитора в 2026?

Пришлите вашу нишу (медицина, языки, кодинг, школа) и учебную программу. Мы вернёмся с 16-недельной архитектурой и планом запуска через 48 часов. Бесплатно.

Позвоните нам → Напишите нам →

Почему большинство ИИ-репетиторов умирают через 2 недели

В конце 2024 года мы провели когортный анализ удержания на трёх ИИ-репетиторах, проходивших стадию seed. Регистрация в первый день была сильной — 35–55 % платных пользователей открывали репетитора. Удержание на 7-й день обваливалось до 18 %. К 30-му дню только у одного из трёх продуктов удержание оставалось двузначным — и именно у этого продукта педагогическая стратегия была встроена в промпты, а не прикручена сбоку.

1. Ловушка чат-бота. Продукт — «ChatGPT для предмета X». Ученик спрашивает, модель отвечает. За неделю ученики понимают, что репетитор — просто машина для ответов, и перестают использовать его для учёбы — они вставляют туда домашку. Эффект новизны проходит. Репетитор так и не узнал, что ученик знает, не подстраивался, не отказывался решать. Это инструмент для списывания с лишними шагами.

2. Нет модели усвоения. Система никак не представляет, что ученик уже выучил. Каждый разговор начинается с нуля. Репетитор не может сказать: «Вы решили три из последних четырёх квадратных уравнений правильно — пора переходить к разложению на множители». Без этого каждое взаимодействие висит в воздухе, оторванное от прогресса. Ученики уплывают.

3. Нет петли вовлечения. Никаких серий, целеполагания, напоминаний по интервальному повторению, дашбордов для родителей или учителей. Без внешних механизмов обязательств кривая оттока ИИ-репетитора повторяет траекторию приложения для медитаций. Формирование привычки требует опор.

4. Ответы вне учебной программы. Репетитор не знает, по какому учебнику занимается ученик, в какой главе он находится, к какому экзамену готовится. Он галлюцинирует педагогически нерелевантным контекстом. RAG, привязанный к учебной программе, — это то, что заставляет репетитора чувствоваться частью курса.

5. Не та метрика успеха. Команда оптимизировала время в приложении и количество сообщений. Ученики, использовавшие приложение чаще всех, учились меньше всех — они перебирали промпты, чтобы вытянуть рабочее решение домашки. Правильная метрика — рост усвоения за час, а не минуты в сессии.

Чем ИИ-репетитор отличается от ChatGPT

Если вы хоть раз использовали ChatGPT, чтобы «помочь с домашкой», у вас уже сложилась интуитивная модель ИИ-репетитора. Эта модель неверна, и поправить её — самое важное, что нужно сделать до проектирования продукта.

Другая цель. Цель ChatGPT — удовлетворить запрос. Цель ИИ-репетитора — вырастить усвоение учеником учебной программы, даже если для этого придётся отказать в ответе. Ученику, спрашивающему «какой ответ к вопросу 7», ответ давать не нужно — нужно дать сократическую подсказку, которая подведёт его к решению.

Другое состояние. ChatGPT по умолчанию не сохраняет состояние между сессиями. Репетитор хранит уровень усвоения по каждой теме, знает, по какой программе занимается ученик, к какому экзамену готовится, какой план у него на следующую неделю. Состояние — это позвоночник адаптации.

Другие границы. ChatGPT отвечает почти на всё. Репетитор отказывается решать домашку дословно, отказывается писать эссе, отказывается делать вычисление, которому ученик должен сам научиться. Этот отказ — педагогический, а не вызванный соображениями безопасности.

Другая оценка. ChatGPT оценивают по качеству ответа. Репетитора оценивают по тому, выросли ли у ученика результаты тестов или показатели по бенчмарку навыков после его использования. Метрика живёт за пределами разговора.

Берите ИИ-репетитора, когда: ученикам нужно расти в усвоении по структурированной учебной программе (подготовка к экзамену, языковая сертификация), а цена неправильных ответов от универсального чат-бота достаточно высока, чтобы оправдать репетитора, который отказывается списывать вместо них.

Берите ChatGPT-Edu или универсальную LLM, когда: сценарий — помощь с ресёрчем, мозговой штурм, помощь в письме или неструктурированное исследование, где нет учебной программы для привязки и нет усвоения, которое нужно отслеживать.

Архитектура ИИ-репетитора из 5 столпов

Каждый ИИ-репетитор, выживающий в продакшене, стоит на пяти компонентах. Уберите любой — и вы откатились до чат-бота.

ИИ-репетитор — архитектура из 5 столпов 1. База учебной программы RAG + онтология 2. Модель усвоения IRT · BKT · DKT 3. Педагогическая стратегия Сократ vs прямой стиль 4. Диалоговый слой LLM + ограничители 5. Движок вовлечения Серии · интервалы · цели Зонт приватности FERPA · COPPA · GDPR · EU AI Act

Модель усвоения и база знаний учебной программы кормят диалоговый слой. Педагогическая стратегия определяет, как этот слой отвечает. Движок вовлечения оборачивает весь путь ученика структурой, формирующей привычку. Всё это лежит под зонтом приватности, который нельзя прикрутить в конце.

Столп 1 — База знаний учебной программы (RAG)

База знаний учебной программы — это позвоночник. Именно она заставляет работать запросы вроде «дай мне похожую задачу» или «объясни фотосинтез так, как объясняет мой учебник за 9-й класс». Без неё репетитор предлагает универсальные интернет-ответы, противоречащие программе ученика.

Слой загрузки. Учебники, расшифровки лекций, презентации, банки задач, прошлогодние экзамены, заметки преподавателей. Конвертируйте каждый документ в чанки по 200–400 токенов с насыщенной метаинформацией: предмет, глава, тема, подтема, код учебной цели, диапазон сложности, ссылка на источник. Удалите пагинацию, колонтитулы; сохраните рисунки с подписями в виде текста.

Выбор эмбеддингов. Подойдут text-embedding-3-large от OpenAI, Cohere Embed v3 или опенсорсный bge-large-en. Различие — не в модели, а в схеме метаинформации чанков. Наивный эмбеддинг только по содержимому проигрывает варианту с богатой метаинформацией на каждом нашем бенчмарке.

Векторное хранилище. Postgres с pgvector для до 10M чанков, Qdrant или Weaviate для шардированного продакшена, Pinecone — для тех, кому удобнее managed-сервис. Для ИИ-репетитора с нуля мы по умолчанию берём pgvector: транзакционная схема живёт в той же базе, на одну систему меньше эксплуатировать.

Онтология учебной программы. Привяжите каждый чанк к коду учебной цели в вашей таксономии. Для школьной математики — Common Core State Standards. Для изучения языков — дескрипторы CEFR. Для подготовки к медицинским экзаменам — контентные планы USMLE. Для буткемпов по программированию — ваш собственный фреймворк компетенций. Онтология — это то, что позволяет модели усвоения и диалоговому слою говорить друг с другом на одном языке.

Логика поиска. Гибридный sparse+dense (BM25 + косинус по векторам), отфильтрованный по текущей теме из модели усвоения, ранжированный по свежести в программе. Возвращайте 4–6 чанков с цитированием, а не один. Диалоговому слою нужны альтернативы для выбора, когда он строит сократическую подсказку.

Столп 2 — Модель усвоения (IRT, BKT, DKT)

Модель усвоения — это представление вида «насколько хорошо этот ученик знает эту концепцию» по каждому ученику и каждой теме. Это самый сложный из столпов, и именно он отделяет репетитора от чат-бота.

IRT (Item Response Theory). Классическая психометрическая модель из 1960-х. У каждого тестового задания есть параметр сложности и параметр дискриминации. У ученика — параметр способности. Вероятность правильного ответа — логистическая функция от способности минус сложность. На IRT работает адаптивное компьютерное тестирование: GRE, USMLE, языковые placement-тесты. Сильные стороны: дёшево обучать, интерпретируемо, хорошо изучено. Ограничения: предполагает статичную способность, нет обучения во времени.

BKT (Bayesian Knowledge Tracing). Скрытая марковская модель, где у каждой темы есть скрытое бинарное состояние — усвоено или нет — и четыре параметра: априорное знание, скорость обучения, частота промахов (усвоивший ученик отвечает неверно), частота угадываний (не усвоивший отвечает верно). После каждого ответа обновляется апостериорное распределение. BKT — рабочая лошадка интеллектуальных обучающих систем; на ней работают продукты Carnegie Learning. Сильные стороны: явно моделирует обучение. Ограничения: темы независимы (нет переноса), бинарное состояние слишком грубое.

DKT (Deep Knowledge Tracing). Рекуррентная нейросеть (LSTM или Transformer), принимающая последовательность пар (тема, верно?) и предсказывающая вероятность правильного ответа на следующее задание по каждой теме. DKT улавливает перенос между темами и более длинные зависимости. Сильные стороны: state-of-the-art точность на стандартном бенчмарке ASSISTments. Ограничения: непрозрачна, требует много данных, тяжелее отлаживать.

Наш дефолт. BKT в первые 90 дней работы, пока вы собираете данные ответов. Переводите высокочастотные темы на DKT, когда у вас наберётся 50 000+ взаимодействий «ученик-тема». Оставьте IRT в потоке только-оценивания (placement-тесты, конец модуля), где адаптивный выбор заданий бьёт фиксированные формы.

АлгоритмГолод по даннымИнтерпретируемостьКогда применять
IRT (1PL / 2PL / 3PL)~500 ответов на заданиеВысокая — сложность и способность скалярныеАдаптивное тестирование, placement
BKT (4 параметра)~50 ответов на темуСредняя — бинарное усвоение и частотыПервые 90 дней, мало данных
DKT (LSTM / Transformer)50 000+ взаимодействийНизкая — непрозрачное скрытое состояниеБольшие объёмы, перенос между темами
PFA (Performance Factor)~30 ответов на темуВысокая — счётчики и логитХолодный старт, простая математика
Гибрид BKT + DKTСвой уровень для каждой темыСредняяПродакшен на масштабе

Берите BKT, когда: вы запускаете нового вертикального ИИ-репетитора с менее чем 10 000 учеников, вам нужно объяснимое усвоение для дашбордов родителей и учителей и модель, которую инженеры смогут отлаживать без ML-команды.

Берите DKT, когда: вы перевалили за 50 000 взаимодействий «ученик-тема», у вас есть ML-команда, и измерения по бенчмарку показывают, что точность BKT вышла на плато.

Столп 3 — Педагогическая стратегия

Педагогическая стратегия — это политика, которая, исходя из состояния усвоения и контекста учебной программы, решает, как репетитору ответить дальше. Это не промпт — это контроллер, выбирающий между промптами.

Сократический. Задавайте наводящие вопросы, никогда не давайте ответ. Используется в Khanmigo, чтобы отказывать в решении домашки. Эффективен для процедурных навыков (математика, кодинг, дебаг). Сложность — в калибровке зазора: вопрос должен быть посилен ученику, иначе тот сдастся.

Прямое объяснение. Объясните концепцию, затем попросите ученика её применить. Лучше работает для декларативных знаний (словарь, анатомия, исторические факты) и для настоящих новичков, у которых ещё нет ментальной модели, чтобы их вели сократически.

Worked example с угасанием подсказок. Покажите полностью разобранный пример, потом частичный с пропущенным последним шагом, потом задачу без подсказок. Сильная доказательная база из теории когнитивной нагрузки. Особенно эффективно для новичков на многошаговых процедурных задачах.

Интервальное повторение. Перепроверьте тему, которую ученик усвоил три дня назад, семь дней назад, двадцать дней назад. Опирается на литературу про эффект тестирования. Контроллер стратегии планирует это сам, без запроса от ученика.

Реальный контроллер стратегии выбирает между этими режимами на каждом ходу — на основе апостериорного усвоения, времени с последней попытки и обнаруженной в разговоре путаницы. Мы реализуем его как небольшой rule engine на Python, который читает из модели усвоения и выдаёт код стратегии, на который ветвится шаблон промпта.

Столп 4 — Диалоговый слой

Диалоговый слой — то, что видят пользователи — архитектурно самая глупая часть системы. Интеллект живёт выше: в усвоении, программе и педагогике. Задача LLM — собрать ответ на естественном языке, имея на входе код стратегии, найденные чанки программы и историю разговора.

Выбор модели. GPT-4o или Claude 3.5 Sonnet для премиальных вертикалей (подготовка к медицинским экзаменам, профессиональная сертификация). Llama 3.3 70B, дообученная на ваших собственных данных репетиторских диалогов, — для школы на масштабе, где доминируют расходы на токены. Gemini Flash — для бюджетных потребительских приложений. Мы бенчим все четыре на каждом новом проекте: ответ никогда не повторяется дважды.

Структура промпта. Системный промпт задаёт роль (репетитор), код стратегии (сократ / прямое объяснение / угасание подсказок), правила отказа («никогда не решать домашку дословно») и контекст программы. Спецификация tool-use для «найди тему», «достань worked example», «запиши обновление усвоения». Стриминговый ответ с задержкой первого токена меньше 500 мс.

Голосовой режим. Если ваша аудитория — ученики младших классов, изучающие язык, или те, кому важна доступность, голос обязателен. OpenAI Realtime API или связка Deepgram + ElevenLabs дают рабочий дуплекс. Бюджет задержек — в нашем production-гайде по голосовым агентам.

Ограничители. Классификатор выходов на отказ (домашка дословно, небезопасный контент), принуждение к цитированию (каждое фактическое утверждение ссылается на чанк программы) и редактирование PII во входящих сообщениях ученика до того, как они попадут к провайдеру LLM. Ничто из этого не опционально под высокорисковым режимом EU AI Act.

Нужен второй взгляд на стек вашего ИИ-репетитора?

Проведём аудит вашей текущей архитектуры, модели усвоения и промптов и вернёмся с 10-страничным отчётом с конкретными правками — обычно за две недели.

Позвоните нам → Напишите нам →

Столп 5 — Движок вовлечения

Вовлечение — это то, что заставит ученика вернуться завтра. Без него даже педагогически идеальный репетитор проигрывает TikTok. Движок вовлечения — отдельная продуктовая поверхность, оборачивающая репетитора.

Целеполагание. Недельная цель, привязанная к росту усвоения, а не к минутам. «Освоить 4 новые подтемы к воскресенью» бьёт «провести 5 часов за учёбой». Модель усвоения умеет считать прогресс; учёт минут оптимизирует не ту метрику.

Серии и интервальные напоминания. Счётчик подряд идущих дней с осмысленным прогрессом (не просто открытий приложения). Push-уведомления, выровненные по графику интервального повторения, а не произвольные ежедневные подсказки, утомляющие пользователя.

Дашборды для родителей и учителей. Для аудитории до 18 лет покупатель — родитель или учитель, а не ученик. Дашборды усвоения с прогрессом, привязанным к программе, — рычаг конверсии. Для школы ежедневная сводка по email обязательна.

Социальное доказательство. Когортные лидерборды по согласию (не по умолчанию), треды учебных групп, peer-челленджи. Хорошо работают, когда аудитория — подростки и младшие 20-летние; контрпродуктивно для взрослых на профессиональных сертификациях — им нужна приватность.

Правила KPI вовлечения. Время до первого вопроса — единственная лучшая KPI онбординга: ученики, добравшиеся до неё за 90 секунд, удерживаются на 30-й день в 3 раза лучше. Недельные активные ученики (WAL), а не ежедневные, — правильная метрика ритма для репетитора: набивка трёх сессий в субботу — валидный паттерн.

Педагогические шаблоны промптов

Большую часть работы делает горстка шаблонов промптов. У нас в продакшене их около 25; ниже — четыре самых используемых.

SOCRATIC_TEMPLATE = """
You are a tutor for {subject}. The student is on topic {topic_code}
({topic_title}). Their current mastery posterior is {mastery:.2f}.
The user said: "{user_msg}".

Strategy: SOCRATIC. Do NOT solve the problem. Ask one leading question that:
- is answerable given mastery {mastery:.2f},
- targets the most likely misconception listed in {misconceptions},
- references the curriculum chunk: {chunk_text}.

If user pastes homework verbatim, refuse and offer a similar problem.
"""

Шаблон прямого объяснения. Применяется, когда апостериорное усвоение ниже 0,3 — ученику нужно сначала объяснить концепцию, а только потом задавать вопросы. Развёртывает чанк программы в 3–5 простых предложениях с одним worked example.

Шаблон угасания подсказок в worked example. Применяется при апостериорном 0,3–0,6. Покажите полный worked example, затем частичный с пустым последним шагом. Ученик заполняет последний шаг и идёт дальше.

Шаблон интервального повторения. Запускается планировщиком вовлечения. Берёт задание, которое ученик ранее усвоил, переформулирует его в свежую задачу и просит решение. Обновляет апостериорное по интервалам.

Шаблон выхода из ступора. Активируется, когда классификатор разговора фиксирует фрустрацию (сентимент + повторные переспрашивания). Репетитор делает паузу, подтверждает чувства, опускает сложность на одну ступень, предлагает начать заново.

Приватность — FERPA, COPPA, EU AI Act

Приватность в образовательном ИИ — не функция, а требование к выходу на рынок. Школьные округа отвергнут ваш продукт, магазины приложений отвергнут ваше приложение, а европейские регуляторы оштрафуют вас, если вы запуститесь без compliance. Планируйте все четыре режима с первой недели.

1. FERPA (Family Educational Rights and Privacy Act, США). Применяется к любой системе, хранящей записи учеников в США. Контроллер данных — школьный округ, вы — «школьное должностное лицо» по контракту. Конкретные требования: подписанное соглашение «school official», запрет на использование данных учеников для рекламы, запрет на передачу третьим сторонам без согласия родителей, право родителей на доступ.

2. COPPA (Children’s Online Privacy Protection Act, США). Обязателен для пользователей младше 13 лет. Подтверждаемое родительское согласие до сбора данных. Минимизация данных. Запрет поведенческой рекламы. Автоматически распространяется и на продукты для общей аудитории, если есть «фактическое знание» о наличии пользователей младше 13 лет. Дефолт для ИИ-репетитора в начальной и средней школе — полный COPPA-compliance, независимо от того, есть ли родительский гейт.

3. GDPR (General Data Protection Regulation, ЕС). Применяется, если хоть один пользователь в ЕС. Правовое основание для обработки — согласие для несовершеннолетних до 16 лет (или до 13 в странах-членах, опустивших порог). Хранение данных в ЕС на уровне хранилища. Право на удаление, переносимость, исправление.

4. Высокий риск по EU AI Act. Приложение III перечисляет «системы ИИ, предназначенные для определения доступа к образовательным учреждениям, оценки результатов обучения или мониторинга поведения учеников во время тестов» как высокорисковые. Обязательно: система управления рисками, управление данными, техническая документация, прозрачность, человеческий надзор, тестирование точности и устойчивости, кибербезопасность. Оценка соответствия до выхода на рынок. Послепродажный мониторинг.

5. Доступность WCAG 2.2 AA. Section 508 в США и European Accessibility Act в ЕС оба ссылаются на WCAG 2.2 AA. Навигация с клавиатуры, контрастность, совместимость со screen reader. Заложить с самого начала — ничего не стоит; докручивать ретроспективно — 6–10 недель переделок.

Модель затрат

Две статьи затрат: разработка (одноразовая инженерная) и эксплуатация (на одного активного ученика в месяц).

Разработка — MVP за 16 недель. Команда из 4 человек (1 senior backend, 1 senior frontend / mobile, 1 ML-инженер, 1 продуктовый дизайнер). Фаза 1 (недели 1–4): загрузка программы, онтология, RAG. Фаза 2 (недели 5–8): модель усвоения (BKT) и веб-приложение для ученика, родителя и учителя. Фаза 3 (недели 9–12): диалоговый слой, ограничители, мобильная оболочка. Фаза 4 (недели 13–16): движок вовлечения, дашборды, обвязка под COPPA / FERPA, бета. Общий диапазон: 13–24 млн ₽ в зависимости от географии и сеньорности. С опытом Quillionz и BrainCert мы обычно укладываемся ближе к нижней границе.

Эксплуатация. Стоимость LLM — доминирующая переменная. На GPT-4o-mini по 11 ₽/M входных + 45 ₽/M выходных токенов и средней сессии репетитора в 12 ходов × 800 токенов ожидаемая стоимость LLM — примерно 3 ₽ за активный час. Обновление эмбеддингов RAG: примерно 15 000 ₽ в месяц на миллион чанков. Векторное хранилище: ~6 000 ₽ в месяц за pgvector на Hetzner серии AX. Итоговая маржинальная стоимость на одного активного ученика в месяц: 90–255 ₽ в зависимости от длины сессии, соотношения голос / текст и амортизации файнтюнинга.

Точка безубыточности. B2C-подписка по 1 499 ₽ в месяц с валовой маржой 60 % требует, чтобы стоимость эксплуатации была меньше 600 ₽ на ученика в месяц. B2B-контракт со школой по 3 000 ₽ за ученика в год требует стоимости эксплуатации меньше 112 ₽ на ученика в месяц. Эта арифметика безубыточности и определяет, дообучать ли Llama или оставаться на GPT.

Build vs buy — ChatGPT-Edu, Squirrel, своё решение

OpenAI ChatGPT-Edu. Хостинг, универсальный, без загрузки учебной программы, без отслеживания усвоения, без педагогической стратегии. Правильный инструмент для вузов, выдающих каждому студенту место в ChatGPT. Неправильный, если цель — продуктовая дифференциация.

Squirrel AI. Зрелая платформа ИИ-репетитора для школы из Китая с сильным движком адаптивного обучения. Доступны white-label-сделки. Сильные стороны: десять лет файнтюнинга на данных усвоения. Ограничения: непрозрачный «чёрный ящик», штаб-квартира в Китае (вопросы к резидентности данных у части покупателей), универсальная программа.

Khanmigo. Репетитор от Khan Academy; не лицензируется как платформа. Полезен как бенчмарк для изучения, не как вендор.

Magic School. Скорее ассистент для учителей в школе (планы уроков, рубрики, поддержка IEP), чем репетитор для учеников. Полезен как комплементарная цель интеграции, не как замена.

Своё решение (наша рекомендация для вертикальной специализации). MVP за 16 недель, полный контроль над моделью усвоения, программой, педагогикой. Дифференциация живёт в глубине вертикали (подготовка к медицинским экзаменам, IELTS, собеседования по разработке ПО), где горизонтальные игроки не могут конкурировать по качеству программы.

Мини-кейс — ИИ-репетитор для подготовки к медицинскому экзамену

Стартап из медицинского образования пришёл к нам в 2024 году с 18 000 вопросов в стиле USMLE, тремя лицензированными учебниками и тезисом: ИИ-репетитор, прокачивающий по высокоприоритетным пробелам каждого конкретного абитуриента. Их v1 был тонкой обёрткой GPT-4. Удержание на 30-й день — 8 %, рост усвоения никем не измерялся.

Перестройка за 16 недель. Недели 1–4: загрузка всех трёх учебников и банка вопросов, привязка к контентному плану USMLE Step 1 (213 кодов тем). Недели 5–8: BKT-модель усвоения, обученная на истории ответов из существующего банка вопросов (1,4 млн ответов — более чем достаточно для BKT, для DKT пока маловато). Недели 9–12: педагогический контроллер «сократ + worked example», диалоговый слой на GPT-4o, правила отказа, откалиброванные на оценочном наборе из 200 промптов. Недели 13–16: планировщик интервального повторения, дашборд ученика с прогнозом вероятности сдать экзамен, бета с 80 платящими пользователями.

Результат. Удержание на 30-й день выросло с 8 % до 38 %. Среднее число вопросов на ученика в неделю выросло с 11 до 47. Самооценка уверенности перед USMLE поднялась с 4,2 / 10 до 6,8 / 10 за 12-недельный цикл подготовки. Модель усвоения определяла самые слабые темы кандидата на неделю раньше, чем планы, составленные людьми. Хотите похожий аудит вашего ИИ-репетитора — позвоните или напишите нам.

Фреймворк принятия решения — запуск за пять вопросов

Q1. Какая вертикаль и какая программа конкретно? Универсальные ИИ-репетиторы проигрывают Khanmigo. Вертикальные ИИ-репетиторы с именованной программой (USMLE Step 1, IELTS Academic, AP Computer Science A) выигрывают, потому что у горизонтальных игроков нет стимула строить такую глубину.

Q2. Есть ли у вас данные программы и история ответов? Если да, BKT обучается за дни. Если нет — нужен 4-недельный спринт загрузки и бутстрап на синтетических ответах. Оба пути допустимы; вопрос только в бюджете.

Q3. Возраст аудитории? До 13 лет = COPPA + дашборд для родителей обязательны. Школа внутри учебного заведения = FERPA + SSO школьного округа. Взрослые на профессиональной сертификации = compliance легче, голос опционален. Возраст аудитории определяет всю архитектуру движка вовлечения.

Q4. Пользователи в ЕС? Если да, применяется и резидентность данных в ЕС, и классификация высокого риска по EU AI Act. Планируйте compliance с первого дня. Это добавит примерно 4 недели к таймлайну.

Q5. Честная цель по росту усвоения? Заранее зафиксируйте бенчмарк. «Усвоенные темы в час» или «прирост по стороннему бенчмарку вроде Lexile или практической оценки IELTS». Без цели команда оптимизирует тщеславные метрики вовлечения.

Подводные камни

1. Обёртка ChatGPT, маскирующаяся под репетитора. Без модели усвоения, RAG, привязанного к программе, и педагогического контроллера у вас чат-бот. Удержание будет плохим, а бренд получит ярлык «инструмент для списывания».

2. Оптимизация на время в приложении. Ученики, использующие репетитора чаще всех, часто учатся меньше всех — они зациклены на «вставил-списал». Оптимизируйте на рост усвоения за час и измеренные результаты.

3. Выбор DKT до того, как появились данные. Нейросетевая модель усвоения на 1 000 учеников даёт точность хуже, чем 4-параметрическая BKT. Сидите на BKT, пока не перевалите за 50 000+ взаимодействий «ученик-тема».

4. Пропуск COPPA / FERPA в MVP. Продажи школьным округам в США закрываются на этапе закупок. Без SSO школьного округа, FERPA-аддендума и документации COPPA вы не пройдёте security review — и сделка испаряется.

5. Нет оценки с человеком в цикле. Каждый релиз должен ехать с оценочным набором из 200 промптов, размеченным экспертами по программе. Без него регрессии в промптах тихо разрушают педагогическое качество.

KPI для измерения

Качественные KPI. Рост усвоения за час (целевой показатель: ≥ 1 подтема за 45-минутную сессию). Время до первого вопроса в первый день (целевой показатель: меньше 90 с). Точность отказов на дословной домашке (целевой показатель: ≥ 95 %).

Бизнесовые KPI. Удержание на 30-й день (целевой показатель: 35 % B2C, 60 % B2B). Недельные активные ученики. NPS дашборда родителей и учителей. Удержание B2B-контрактов. Стоимость одного активного ученика в месяц.

KPI надёжности. 99,9 % доступности в часы пиковой учёбы. Задержка первого токена меньше 500 мс по p95. Полнота редактирования PII выше 99,5 % на оценочном наборе.

FAQ

Чем ИИ-репетитор отличается от ChatGPT?

ИИ-репетитор отказывается решать задачи дословно, хранит уровень усвоения по каждой теме, следует явной педагогической стратегии (сократ / прямое объяснение / угасание подсказок) и привязан к конкретной учебной программе. ChatGPT не делает ничего из этого по умолчанию. Другая целевая функция, другая архитектура.

BKT или DKT для отслеживания усвоения?

Начните с BKT. Переводите высокочастотные темы на DKT после того, как наберётся 50 000+ взаимодействий «ученик-тема» и бенчмарк покажет, что точность BKT вышла на плато. Ниже этого порога BKT в наших экспериментах опережает DKT и заметно проще в отладке.

Что EU AI Act значит для ИИ-репетитора?

ИИ, используемый для определения доступа к образованию, оценки результатов обучения или мониторинга экзаменов, относится к высокорисковым по Приложению III. Обязательные требования: система управления рисками, техническая документация, человеческий надзор, тестирование точности, послепродажный мониторинг, оценка соответствия. Закладывайте 4 дополнительные недели compliance-работы для запусков в ЕС.

Сколько займёт запуск MVP ИИ-репетитора?

16 недель за 13–24 млн ₽ с командой из 4 человек: senior backend, senior frontend / mobile, ML-инженер, продуктовый дизайнер. Включает загрузку программы, BKT-модель усвоения, диалоговый слой с правилами отказа, мобильное и веб-приложение и бету с 50–100 платящими пользователями.

Нужен ли голосовой режим?

Обязателен, если ваша аудитория — ученики младших классов, изучающие язык или те, кому важна доступность. Опционален, но положительно влияет на вовлечение для взрослых, изучающих языки и тренирующих презентационные навыки. Голос добавляет около 4 недель к MVP и примерно 4,5 ₽ за активный час ученика к стоимости эксплуатации.

Как помешать ученикам использовать репетитора для списывания?

Правила отказа в системном промпте (никаких дословных решений), классификатор детекции вставок, классификатор выходов, переписывающий дословные решения в сократические подсказки, и дашборд для учителя с пометкой подозрительных сессий. Включайте оценочный набор из 200 промптов для регрессионных проверок точности отказов на каждом релизе.

Khanmigo, ChatGPT-Edu, Squirrel AI — можно просто купить?

Если вы учреждение, покупающее универсального репетитора для множества курсов, — ChatGPT-Edu подойдёт. Если хотите продуктовую дифференциацию в вертикали (подготовка к медицинским экзаменам, IELTS, собеседования по программированию), стройте своё. Khanmigo не лицензируется. Squirrel AI можно купить, но штаб-квартира в Китае убивает часть покупателей по резидентности данных.

Какая правильная метрика успеха для ИИ-репетитора?

Рост усвоения, измеренный против стороннего бенчмарка. Для языка — прирост на placement-тесте CEFR. Для подготовки к экзамену — прогноз балла на снятой с публикации официальной работе. Для школы — стандартизированные тесты там, где это разрешено лицензией. Время в приложении — тщеславная метрика, часто отрицательно коррелирующая с обучением.

E-learning

Опорный гайд по платформе e-learning

Платформенный слой, в который встраивается этот ИИ-репетитор.

Оценка

Оценка LLM-приложений в продакшене

Как удерживать качество репетитора от регрессий.

Голос

Голосовой Realtime-агент в продакшене

Бюджет задержек и стек для голосового режима репетитора.

RAG

RAG по видео, аудио и чату

Паттерны RAG, полезные для загрузки учебной программы.

Оценка проекта

Гайд по оценке проектов от CTO

Разобранный пример оценки MVP ИИ-репетитора.

Готовы запустить ИИ-репетитора, которым ученики действительно будут пользоваться?

ИИ-репетиторство стало мейнстримом за 24 месяца. Планка «выглядеть достоверно» поднялась — обёртки над ChatGPT отсеиваются закупщиками школьных округов, родительским взглядом и регуляторами в ЕС. Планка «реально растить усвоение» стояла там всё это время: RAG, привязанный к учебной программе, явная модель усвоения, педагогическая стратегия, отказывающаяся решать домашку, движок вовлечения, считающий обучение, а не минуты, и зонт приватности, готовый к первой неделе запуска.

MVP вертикального ИИ-репетитора запускается за 16 недель за 13–24 млн ₽. Ров — глубина в именованной программе: USMLE Step 1, IELTS Academic, AP CSA, государственные стандарты школьной математики — туда, куда горизонтальные игроки не вкладываются. С Quillionz и BrainCert за плечами мы можем сжимать сборку за счёт переиспользования паттернов загрузки программы и моделей усвоения и делаем это на каждом ИИ-репетиторе, который мы запустили с 2023 года.

Хотите план запуска ИИ-репетитора за 16 недель?

Пришлите вашу нишу (медицина, языки, кодинг, школа) и ссылку на учебную программу. Мы вернёмся с архитектурой, выбором модели усвоения и оценкой стоимости через 48 часов. Бесплатно.

Позвоните нам → Напишите нам →

  • Технологии