
Интеллектуальные обучающие системы (intelligent tutoring systems, ITS) в 2026 году — уже не лабораторная диковинка. Они работают на миллионах учеников в Khan Academy, Carnegie Learning, Duolingo и внутри европейских корпоративных платформ обучения, давая измеримый прирост обученности на уровне d = 0,6–0,8. Это руководство показывает, как инженеры Фора Софт реально строят такие системы: пятислойную эталонную архитектуру, ландшафт моделей и knowledge tracing 2026 года, паттерн RAG плюс привязка к учебной программе, матрицу требований, которые становятся обязательными к 2 августа 2026 года, и путь запуска за 10–14 недель.
Ключевые тезисы
- Объём рынка — 795 млрд ₽, к 2030 году превысит 3 трлн ₽. Только сегмент AI-репетиторов — 206 млрд ₽ в 2026 году с темпом роста около 30% в год. Самый большой сегмент — высшее образование, самый быстрорастущий — корпоративное обучение.
- Доказательства реальны: d = 0,66–0,79. Работы Кулика и Флетчера, ВанЛена, а также Carnegie Learning показывают: пошаговые ITS вплотную приближаются к индивидуальному репетитору-человеку — но только если у системы есть модель ученика, привязка к программе и сократическое сопровождение. Без этих защитных контуров LLM вредят устойчивому обучению (Mollick & Mollick 2024, PNAS 2025).
- Knowledge tracing — это позвоночник системы. BKT остаётся самым понятным базовым подходом; SAKT и SAINT (на трансформерах) теперь дают AUC 0,82–0,85 на EdNet и ASSISTments. Выбирайте одну из них — не изобретайте свою модель, если у вас меньше 10 млн взаимодействий.
- Модели на 2026: Claude Sonnet 4.6 — для сократических рассуждений и диагностики ошибочных представлений, GPT-5 — для математики и кода, Gemini 2.5 Flash — для дешёвых диалогов в большом объёме, Llama 4 на H200/B200 — для on-prem-сценариев с повышенными требованиями к приватности. Гибридная маршрутизация снижает стоимость токенов на 70–85%.
- Регуляторные требования 2026 года связывают жёстко. EU AI Act, Приложение III (системы высокого риска) — 2 августа 2026 года; обновлённый COPPA — 22 апреля 2026 года; ADA Title II и WCAG 2.2 AA — 24 апреля 2026 года; California CAADCA — 1 января 2026 года; сертификация FERPA уже действует.
- Стоимость — решённая проблема. Совокупная стоимость LLM на одну обучающую сессию в 2026 году — 0,03–2 ₽, то есть примерно 37–150 ₽ на ученика в год. Реальные деньги уходят на модель ученика, граф программы и соответствие нормативам.
Зачем Фора Софт написала это руководство
Мы профессионально разрабатываем продукты обучения на базе AI. Наша практика e-learning и направление AI-интеграции работают вместе на каждом проекте ITS: интеграция с LMS, инфраструктура видео для живых занятий, распознавание речи, векторные хранилища, инференс модели ученика и скучный, но обязательный каркас соответствия, благодаря которому деплои по EU AI Act, Приложение III, реально проходят аудит.
За последние двенадцать месяцев мы наблюдали три одинаковые ошибки, которые губят проекты ITS: команды прикручивают сырой промпт GPT-5 к странице учебника и называют это «репетитором», запускают модель ученика, которая ничего не отслеживает, либо пропускают привязку к учебной программе — и модель начинает выдумывать несуществующие правила производной. Все три ошибки решаются. В этой статье — то, что реально работает.
Прорабатываете концепцию интеллектуальной обучающей системы?
За 30 минут разговора по телефону или почте мы помогаем определить контуры учебной программы, модели ученика и требований к соответствию.
Что такое «интеллектуальная обучающая система» в 2026 году
В 2015 году «ITS» означала математический репетитор на правилах с вручную закодированным деревом подсказок. В 2020 — глубокую модель knowledge tracing плюс инструмент авторизации контента. В 2026 году ITS — это пятислойная система: (1) модель ученика, отслеживающая, какими навыками студент действительно овладел, (2) доменный граф учебной программы, определяющий, что и в каком порядке преподаётся, (3) педагогическая модель, решающая «подсказать, спросить, направить или двигаться дальше», (4) мультимодальный интерфейс, принимающий голос, рукописный ввод, код и схемы, и (5) слой оценки, который непрерывно измеряет прирост обученности и питает A/B-эксперименты.
LLM — это один компонент, а не вся система. Репетитор, который состоит только из LLM, обёрнутой педагогическим промптом, — это то, что Молик и Молик (2024) называют «GPT Base»: ученики получают краткосрочный прирост, а затем — при отключении доступа — показывают результат на 17% хуже контрольной группы. Их же вариант «GPT Tutor», с сократическим промптом и привязкой к программе, дал +127% устойчивого прироста, сохраняющегося после отключения доступа. Разница — в остальных четырёх слоях.
Рынок: цифры, формирующие категорию 2026 года
Каждый совет директоров EdTech, которому мы делаем брифинг, начинает с одного и того же вопроса: рынок ещё растёт или уже на пике? Данные 2025–2026 говорят: растёт.
| Показатель | 2025–2026 | Источник |
|---|---|---|
| Мировой рынок AI в образовании (2026) | 795 млрд ₽, с ростом до 3 трлн ₽ к 2030 году | Grand View Research, 2026 |
| Подсегмент AI-репетиторов | 206 млрд ₽ в 2026 году, 1,3 трлн ₽ к 2033 году | Grand View Research, AI Tutors Market 2026 |
| CAGR 2026–2033 | 30,5% | Grand View Research, 2026 |
| Еженедельное использование AI школьниками K-12 (декабрь 2024) | 26% и продолжает расти примерно на 2 п.п. за квартал | EdWeek Research Center, 2025 |
| Приоритет AI в корпоративном обучении | 47% руководителей называют переобучение по AI приоритетом №1 на ближайшие 18 месяцев | LinkedIn Workplace Learning Report, 2026 |
| Траектория Khan Academy Khanmigo | Доступ на уровне округов, цель — более 1 млн учеников к концу 2026 года | Khan Academy 2026 Roadmap |
| Carnegie Learning MATHia | Более 600 тыс. учеников, 2 400+ школ США | Отчёт Carnegie Learning, 2025 |
| Подписчики Duolingo Max | Более 500 тыс. платящих (начало 2026) | Инвесторский отчёт Duolingo, Q4 2025 |
Перевод для продуктовых руководителей: рынок вас финансирует, доказательная база достаточно прочна, чтобы выдержать скептическую закупку, а референсные проекты Khan, Carnegie, Duolingo и Squirrel AI дают защитимые бенчмарки. Проекты губит не рыночная конъюнктура, а исполнение.
Пятислойная эталонная архитектура
Любая ITS, которую мы запускали в продакшен, раскладывается на одни и те же пять слоёв. Если хотя бы один из них слаб или отсутствует — именно там первым делом всплывают претензии аудита, жалобы учеников или плоские кривые прироста обученности.
| Слой | Что делает | Технологии 2026 года |
|---|---|---|
| 1. Модель ученика | Отслеживает освоение каждого навыка во времени | BKT, DKT, SAKT, SAINT, AKT |
| 2. Доменный граф / граф программы | Описывает навыки, предпосылки, оценивания | Neo4j, онтологии учебных программ, метаданные OER Commons |
| 3. Педагогическая модель | Решает: подсказать, спросить, направить, двигаться дальше или вернуть на повтор | Claude Sonnet 4.6, GPT-5, Gemini 2.5 Pro с RAG и контекстом состояния ученика |
| 4. Мультимодальный интерфейс | Голос, рукописный ввод, код, схемы, математические рукописи | Deepgram Nova-3, Mathpix, Judge0 / Piston, SymPy, Wolfram Alpha, Lean 4 |
| 5. Оценка и аналитика | Измеряет прирост обученности, запускает A/B, выявляет искажения, ведёт дашборды | Statsig, GrowthBook, CUPED, кастомная психометрика IRT, Metabase |
Слой, который команды чаще всего недооценивают, — пятый. Без него нельзя понять, помогает или вредит изменение промпта, а значит каждый деплой превращается в гадание. Мы не запускаем ITS без пайплайна экспериментов с инструментовкой CUPED на первом же дне.
Порядок, выстраданный практикой
Стройте слои в порядке 2 → 5 → 1 → 3 → 4. Сначала граф программы (без него не на что опираться при привязке), потом пайплайн оценки (нужно уметь измерять до того, как начнёте учиться), затем модель ученика (это долгосрочный актив с самым большим рычагом), потом педагогические промпты, и в самом конце — мультимодальный ввод-вывод. Команды, которые стартуют с промпта LLM, а остальные слои прикручивают потом, почти всегда перестраивают модель ученика в течение 90 дней.
Knowledge tracing: тихий центр тяжести
Каждое педагогическое решение системы — какую задачу подать следующей, когда предложить подсказку, когда зафиксировать освоение — опирается на модель ученика. Промахнитесь здесь — и никакая хитрость LLM это не починит. Сделайте правильно — и даже небольшая модель даст прирост d = 0,6+.
| Модель | Архитектура | AUC (EdNet / ASSISTments) | Когда подходит |
|---|---|---|---|
| BKT | Двухсостоянная скрытая марковская модель на каждый навык | 0,71–0,76 | Понятные учительские дашборды, небольшие датасеты |
| DKT | LSTM / GRU по истории взаимодействий | 0,76–0,82 | Перенос между навыками, кривые забывания |
| SAKT | Трансформер с self-attention | 0,81–0,84 | Объяснимые веса внимания, датасеты среднего размера |
| SAINT | Двунаправленный трансформер с раздельными энкодерами вопроса и ответа | 0,82–0,85 | Текущий SOTA на масштабах EdNet (более 10 млн взаимодействий) |
| AKT | Внимание плюс IRT-оценка сложности | 0,80–0,83 | Адаптивное оценивание, где важна сложность |
| Гибрид Transformer×Bayesian | Бэкбон SAINT с байесовским последним слоем | 0,83–0,86 | Появился в 2025; точность плюс калиброванная неопределённость |
Наша рекомендация по умолчанию: начинайте с BKT, если у вас меньше 500 тыс. взаимодействий, переходите на SAKT в районе 1–5 млн взаимодействий, и двигайтесь к SAINT или гибриду Transformer×Bayesian только после 10 млн взаимодействий и при наличии выделенного ML-инженера, способного следить за дрейфом. Не изобретайте кастомную архитектуру. Литературы накоплено достаточно, а отрыв SAKT от любого собственного решения почти всегда меньше, чем операционные затраты на его поддержку.
Ландшафт LLM в 2026 — какая модель для какой задачи репетитора
Универсального «LLM для репетитора» не существует. Каждый продакшен-деплой, который мы запускали, использует 2–4 модели за роутером, выбираемые по задаче и стоимости. Вот матрица, по которой мы в апреле 2026 года ведём брифинги для клиентов.
| Модель | Вход, ₽/млн токенов | Выход, ₽/млн токенов | Когда подходит |
|---|---|---|---|
| Claude Sonnet 4.6 | 225 ₽ | 1 125 ₽ | Сократический диалог, диагностика заблуждений, качество обратной связи |
| Claude Haiku 4.5 | 75 ₽ | 375 ₽ | Генерация подсказок, краткие пересказы, диалог в большом объёме |
| GPT-5 | 187 ₽ | 750 ₽ | Многошаговая математика, обучение коду, использование инструментов |
| Gemini 2.5 Pro | 93 ₽ | 750 ₽ | Мультимодальный ввод (изображения, схемы, рукописная работа) |
| Gemini 2.5 Flash | 5 ₽ | 22 ₽ | Дешёвый диалог большого объёма, быстрая обратная связь |
| LearnLM (Google) | Бесплатно с Workspace for Education | — | Школы K-12, уже работающие в Google Classroom |
| Llama 4 70B / 405B (on-prem) | Капитальные затраты (340 ₽/час за H200) | Капитальные затраты | Деплои с повышенными требованиями к приватности (ЕС, медицина, госсектор) |
| Mistral Large 3 | 150 ₽ | 450 ₽ | Европейская суверенная альтернатива, on-prem с квантованием FP8 |
Типовая политика маршрутизации: Gemini 2.5 Flash берёт на себя 70% простых взаимодействий (повторение, подтверждение, короткая обратная связь), Claude Sonnet 4.6 — 20% сократического диалога, GPT-5 — 8% тяжёлой математики и кода, Gemini 2.5 Pro — 2% мультимодальных задач (рукописная работа или интерпретация схем). Такой микс обычно даёт стоимость LLM на сессию в диапазоне 0,3–1,5 ₽.
Наше мнение
Начинайте любой проект ITS с Claude Sonnet 4.6 как слоя рассуждений и Gemini 2.5 Flash как диалогового слоя по умолчанию — даже если планируете потом мигрировать. Sonnet 4.6 — самый надёжный сократический репетитор из всего, что мы запускали в продакшен: он действительно задаёт наводящие вопросы вместо того, чтобы кидаться к ответу, а это критично, когда цель — устойчивое обучение, а не метрики вовлечённости.
RAG и привязка к программе: брандмауэр против галлюцинаций
Под нагрузкой непривязанная LLM-репетитор начнёт придумывать правдоподобно звучащие, но неверные математические правила, путать исторические события и рекомендовать темы за пределами программы ученика. RAG (retrieval-augmented generation) поверх структурированной базы знаний по учебной программе — это и есть брандмауэр. Он не опционален.
Паттерн, который мы запускаем, выглядит так:
1. Загрузка учебной программы. Разбираете принятые стандарты (Common Core, NGSS, программы AP, европейские рамки результатов обучения, внутренние корпоративные карты компетенций) на структурированные чанки. Каждый чанк помечаете уровнем класса, навыками-предпосылками, уровнем таксономии Блума и примерами заданий.
2. Эмбеддинги. OpenAI text-embedding-3-large (1536 измерений) для англоязычных программ, Gemini Embedding 2 — для многоязычных, Cohere Embed v3 — для деплоев, где важна цена. Храните в Pinecone, Weaviate или Qdrant с фильтрами по метаданным (класс, предмет, код стандарта).
3. Поиск. На каждом ходе репетитора достаёте топ-k (обычно 5–8) наиболее семантически релевантных чанков программы, отфильтрованных по классу ученика и активному узлу навыка из модели ученика.
4. Привязанная генерация. Передаёте LLM найденные чанки, состояние ученика (освоенные и осваиваемые навыки) и педагогическую инструкцию («задай сократический вопрос, не решай»). Требуете цитат с кодами стандартов; отбраковываете ответы, не прошедшие проверку цитирования.
5. Верификация. Для математики и естественных наук прогоняете предлагаемый моделью шаг решения через символьный верификатор (SymPy, Wolfram Alpha или тактики Lean 4 для доказательств). Для кода — запускаете его в песочнице Judge0 или Piston до показа ученику. Один этот шаг убирает около 95% галлюцинаций по математике.
Мультимодальный ввод-вывод: базовый уровень 2026
Ученики не печатают уравнения. Они их пишут. Они не набирают код аккуратно. Они вставляют черновую работу как есть. А требования доступности всё настойчивее предписывают, чтобы каждое задание можно было выполнить хотя бы двумя способами. Ваша ITS 2026 года должна нативно принимать:
Голосовой ввод. Deepgram Nova-3 для потокового распознавания речи в реальном времени (12–15% WER на реальной речи учеников, диаризация говорящих, 40+ языков) или Whisper v3 для on-prem с повышенной приватностью. Голос открывает обучение K-3, поддержку учеников с дислексией и работу без рук. Полный обзор ландшафта ASR мы давали в подробном разборе доступности подкастов — там разобраны компромиссы по ASR.
Рукописный ввод и математическая запись. Mathpix (распознавание математики → LaTeX, точность 95%+ на печатных уравнениях, 85%+ на рукописных) или Google Handwriting Recognition для обычного текста. Mathpix — единственный продакшен-вариант, которому мы доверяем в работе с матанализом и матрицами.
Исполнение кода. Judge0 (SaaS, 70+ языков) для большинства деплоев, Piston (open-source) — когда нужен on-prem. Каждый код, который сдаёт ученик, исполняется в изолированном контейнере до того, как репетитор начнёт его комментировать. Это превращает «у вас синтаксическая ошибка» из предположения в факт.
Математическая верификация. SymPy (open-source, быстрый, покрывает K-12 и алгебру с матанализом для бакалавров), Wolfram Alpha API (более широкое символьное покрытие, 750–2 250 ₽/мес на разработчика), Lean 4 с тактиками для проверки уровня доказательств (всё чаще используется на продвинутых программах CS и математики).
Мультимодальный ввод LLM. GPT-5, Gemini 2.5 Pro и Claude Opus 4.6 принимают изображения в продакшен-качестве. Ученик может сфотографировать доску, загрузить скриншот или вставить схему — и репетитор отвечает на то, что реально видит, а не на пересказ. Паттерны UX для таких сценариев мы разбираем в нашем руководстве по AI-доступности в UI/UX.
Адаптивное оценивание: IRT, CAT и Elo
Теория ответов на задания (item response theory, IRT) — тихая рабочая лошадка серьёзных ITS. 2-PL IRT (сложность плюс дискриминативность) — это нижняя планка; 3-PL IRT добавляет параметр угадывания для тестов с выбором ответа; многомерные модели IRT моделируют сразу несколько латентных навыков. Компьютерное адаптивное тестирование (CAT) использует эти модели, чтобы выбирать следующее задание там, где стандартная ошибка оценки способности минимальна, и достигать той же точности измерения примерно вдвое меньшим числом заданий.
Для небольших платформ (менее ~100 тыс. предъявленных заданий) рейтинговая оценка сложности по Elo проще в эксплуатации и показывает результат в пределах ~5% от полноценного IRT на большинстве реальных задач. Duolingo, DreamBox и Quizlet используют варианты Elo. Начинайте оттуда, а на полный IRT переходите, когда наберёте более 5 млн ответов на задания и наймёте специалиста по тестированию.
Соответствие требованиям: что вступает в силу в 2026
ITS сидит в самом центре регуляторной мишени. Образование, автоматизированные решения и работа с несовершеннолетними наслаивают друг на друга требования, и 2026-й — год, когда несколько из них вступают в полную силу.
| Регулирование | Охват | Дата вступления в силу в 2026 | Что требует |
|---|---|---|---|
| EU AI Act, Приложение III (высокий риск) | Вся ЕС; ITS, используемые для распределения, оценивания или прокторинга | 2 августа 2026 | Система управления рисками, технический файл, контроль со стороны человека, постмаркетинговый мониторинг |
| GDPR, статья 22 | Пользователи в ЕС; «исключительно автоматизированные» решения с существенным эффектом | Действует | Проверка человеком решений с высокими ставками (распределение, метки вмешательства) |
| Обновлённый COPPA 2025 | США, дети младше 13 лет | Срок соответствия — 22 апреля 2026 | Подтверждаемое родительское согласие до передачи данных третьим лицам; запрет поведенческой рекламы |
| FERPA | Все школы K-12 США и вузы, получающие федеральное финансирование | Действует (сертификация штатов подана в 2025) | Защита образовательных записей; обязательны соглашения о работе с данными с поставщиками |
| ADA Title II + WCAG 2.2 AA | Госорганы штатов и муниципалитетов США, включая публичные школы | 24 апреля 2026 (для населения >50 тыс.) | Все цифровые инструменты соответствуют WCAG 2.2 AA; принудительное исполнение через жалобы в DOJ |
| California CAADCA + SOPIPA | Пользователи в Калифорнии | 1 января 2026 | Оценка воздействия на защиту данных для AI с высоким риском, запрет продажи данных |
| India DPDP Act | Пользователи в Индии | Поэтапно в 2025–2026 | Явное согласие, уведомление об инцидентах, DPO для значимых фидуциариев |
| ISO/IEC 23894 (управление AI-рисками) | Добровольный, всё чаще требуется при закупках | — | Документированная таксономия рисков, планы обработки, непрерывный пересмотр |
Самое крупное изменение 2026 года — классификация по статье 6 и Приложению III EU AI Act. Если ваша ITS даёт рекомендации по распределению, формирует оценки, используемые в решениях, или ведёт прокторинг, она относится к высокорисковым. Закладывайте полный технический файл, документированный контур контроля со стороны человека и план постмаркетингового мониторинга. Пропустите — рискуете остановкой запуска в ЕС.
Наш быстрый путь к соответствию
Мы встраиваем технический файл EU AI Act в инженерный процесс с первой недели: каждое изменение модели ученика, ревизия промпта и обновление датасета пишет запись в журнал соответствия только на дозапись. К 2 августа 2026 у клиента готов полный аудиторский след — а не паническая трёхмесячная гонка по документации.
Экономика стоимости и задержек
Стоимость LLM редко становится узким местом юнит-экономики ITS в 2026 году. Инфраструктура, проверка человеком и подготовка контента стоят кратно больше. Вот разбивка, которой мы пользуемся для типового математического репетитора K-12 на 20 обучающих сессий ученика в месяц.
| Компонент | Стоимость на ученика в месяц |
|---|---|
| Токены LLM (гибридная маршрутизация, 20 сессий) | 7–45 ₽ |
| STT / ASR (голос, ~30 минут в месяц) | 11–22 ₽ |
| Эмбеддинги и векторное хранение | 1–3 ₽ |
| API верификации математики и кода | 3–11 ₽ |
| Инфраструктура (вычисления, хранение, CDN) | 37–112 ₽ |
| Проверка человеком / QA (выборочно) | 22–75 ₽ |
| Итого на ученика в месяц | 84–270 ₽ |
При цене подписки 750–1 500 ₽/мес или цене места по школьной лицензии 3 750–11 250 ₽/год валовая маржа — 70–90% до распределения затрат на инженерию, соответствие и контент. Экономика сходится; стратегический вопрос — ARPU против объёма, а не себестоимость.
Мини-кейс: европейская корпоративная платформа переобучения запускает ITS за 12 недель
Клиенту Фора Софт в европейской страховой компании потребовалось переобучить около 5 000 специалистов по урегулированию убытков базовой работе с данными на Python в рамках их программы готовности к EU AI Act 2026 года. Классическое аудиторное обучение обошлось им в 1,2 млн € в 2025 году и подняло долю завершивших с 34% до 41%. Нас попросили сделать репетитора, который масштабируется без новых аудиторных часов.
Что мы запустили за 12 недель:
- Модель ученика: SAKT поверх внутренней карты компетенций по Python (48 навыков, 380 заданий, ~2 000 обучающих взаимодействий из предыдущего пилота).
- Граф программы: справочник Python.org плюс внутренние стандарты работы с данными, вложены через OpenAI text-embedding-3-large в Weaviate.
- Педагогика: Claude Sonnet 4.6 с сократическим промптом, привязанный к топ-6 фрагментам программы и текущему вектору освоения ученика; Gemini 2.5 Flash отвечал за повторение, подтверждения и быструю обратную связь.
- Мультимодальность: ячейки кода в стиле Jupyter исполнялись в Piston (on-prem ради приватности); голосовые вопросы и ответы — через Deepgram Nova-3.
- Оценка: A/B-тесты вариантов промпта с CUPED на Statsig; пред- и постоценивание с калибровкой сложности по IRT.
- Соответствие: полный технический файл по статьям 9 и 11 EU AI Act, шаг проверки человеком по GDPR, статья 22, на любую метку «ученик в зоне риска», пройденный аудит доступности WCAG 2.2 AA.
Результаты после 4 месяцев эксплуатации: доля завершивших выросла с 41% до 63% (+22 п.п.), время до освоения сократилось на 31%, стоимость одного завершения упала с 350 € (аудитория) до 58 € (ITS плюс проверка человеком), а DPO клиента подписал технический файл EU AI Act на 11-й неделе.
5 ловушек, убивающих проекты интеллектуального обучения
1. «Да просто промптом подёргаем GPT». Так получают «GPT Base» по Молику — краткосрочная вовлечённость, потом обвал обученности при отключении доступа. Без модели ученика, привязки к программе и сократического сопровождения LLM — это сервис «сделать домашку», а не репетитор.
2. Пропуск символьного верификатора. LLM уверенно ошибаются в арифметике, алгебре и матанализе. Вызов SymPy или Wolfram Alpha до показа ответа ученику — дешёвая страховка. Пропустите — и научите целый поток уверенно считать, что 2/3 + 1/4 = 3/7.
3. Нет пути обхода для учителя. Учителям нужно видеть состояние ученика, иметь возможность не согласиться с ним и вручную сдвинуть ученика вперёд или назад. ITS, которые этого не дают, становятся враждебными учителю — и внедрение умирает.
4. Доступность откладывают на потом. ADA Title II и WCAG 2.2 AA — это новая нижняя планка. Дотягивание доступности задним числом стоит в 3–5 раз дороже, чем встраивание с самого начала, а дедлайн 24 апреля 2026 — жёсткая регуляторная линия, а не ориентир.
5. Полёт вслепую по приросту обученности. Если вы не можете замерить, лучше ли промпт v18 обучает, чем v17, вы гадаете. Инструментованное по CUPED A/B-тестирование на прирост обученности (а не только на вовлечённость) — не опция.
Эвристика по бюджету, которой мы пользуемся
Для среднего проекта ITS (один предмет, 10–50 навыков, 5–50 тыс. учеников) закладывайте 180–400 тыс. € на разработку за 10–14 недель, примерно так: 40% инженерия, 25% учебная программа и контент, 20% соответствие и доступность, 15% оценка и A/B. Кто называет меньше — обычно пропускает модель ученика или соответствие, а за оба потом приходится платить тройную цену. Готовы разобрать строки сметы по телефону или почте.
KPI: что измерять
В долгосроке имеет значение единственный KPI — прирост обученности (нормированный или d Коэна). Метрики вовлечённости могут расти без улучшения обученности и наоборот. Тем не менее, продакшен-ITS обычно отчитывается по такому набору:
- Нормированный прирост обученности. (посттест% − претест%) / (100 − претест%); цель — >0,40.
- d Коэна относительно контроля. Цель >0,5 относительно традиционного обучения; потолок в литературе — около 0,8.
- Доля завершивших. Процент записавшихся, дошедших до освоения целевого набора навыков.
- Время до освоения. Медианное число минут на навык; должно падать на ~15–30% относительно неадаптивной базы.
- Калибровка использования подсказок. Доля учеников с 2–4 подсказками на задачу (оптимальная полоса); >5 — сигнал излишней опеки.
- Уровень галлюцинаций. Доля ответов репетитора, помеченных как ошибочные символьным верификатором или проверяющим человеком; цель <1% для математики K-12.
- Соответствие доступности. Доля прохождения автоматического и ручного аудита WCAG 2.2 AA; цель — 100%.
- Использование учительского обхода. Доля потоков, где учитель трогает модель ученика; здоровый диапазон — 10–25%.
Когда НЕ стоит строить ITS своими силами
Не стройте свою ITS, если выполняется хотя бы одно из условий: (а) у вас меньше 1 000 учеников и нет ясной траектории к 10 тыс., (б) программа меняется чаще двух раз в год, (в) в команде нет ML-инженера и нет плана его нанять, (г) для предмета нет символьного верификатора, и вы готовы мириться с уровнем галлюцинаций 5–15%, (д) ваш отдел закупок не вытянет затраты на соответствие EU AI Act, Приложение III. В этих случаях лицензируйте Khanmigo, MATHia, Century Tech или специализированного отраслевого вендора и сосредоточьте инженерную силу на интеграции.
Фреймворк принятия решений — выбор стека за шесть вопросов
Ответьте на эти вопросы до написания первой строки кода:
- Какой предмет и класс? Математика и STEM — нужен символьный верификатор; гуманитарные дисциплины — RAG плюс оценка по рубрикам; языки — произношение плюс диалог; кодинг — изолированное исполнение.
- Сколько у вас данных о взаимодействиях? <500 тыс. — BKT; 1–10 млн — SAKT; >10 млн — SAINT или гибрид.
- Какая юрисдикция? ЕС — закладывайте EU AI Act, Приложение III, с первой недели; США K-12 — COPPA + FERPA + ADA; Калифорния — CAADCA.
- Какой профиль приватности? Корпорации, госсектор, медицина — on-prem Llama 4 или Mistral Large 3; потребительский EdTech — API с подписанными соглашениями о данных.
- Какие модальности нужны? Голос плюс рукописный ввод плюс код поднимают планку инженерных усилий примерно на 30% относительно только текста.
- Какая метрика успеха? Вовлечённость, завершение или прирост обученности? Полный стек оправдан только третьим; первые две часто закрываются более лёгкой адаптивной системой контента.
Хотите пройти этот фреймворк вместе с нами?
30 минут разговора, никакой презентации. На выходе — рекомендация по стеку и реалистичный бюджет.
Сценарий внедрения: путь за 10–14 недель
Любой проект ITS, который мы ведём, проходит одни и те же фазы. Длительность гнётся под объём, но не под структуру.
| Неделя | Фаза | Результаты |
|---|---|---|
| 1–2 | Обследование и охват соответствия | Граф программы v0, матрица соответствия, план интеграции с LMS |
| 3–4 | RAG и эмбеддинги | Заполнена векторная БД, оценка качества поиска, защитные контуры цитирования |
| 5–6 | Модель ученика | Обучена BKT или SAKT, базовый уровень AUC, подобраны пороги освоения |
| 7–8 | Педагогика и мультимодальность | Роутер LLM, сократические промпты, подключены STT, рукописная математика, исполнение кода |
| 9–10 | Оценка и A/B | Подключены Statsig / GrowthBook, CUPED, инструментовка прироста обученности |
| 11–12 | Соответствие и доступность | Технический файл EU AI Act, аудит WCAG 2.2 AA, подписан FERPA и COPPA |
| 13–14 | Запуск и подготовка учителей | Дашборды для учителей, обучение, мониторинг, передача под SLA |
Куда движутся ITS в 2026–2027
Агентные репетиторы. Следующая волна — не лучший одиночный промпт, а цикл «планировщик-исполнитель», в котором репетитор ставит цель сессии, выбирает инструменты (поиск, верификатор, песочница кода, рендерер математики) и контролирует прогресс. Claude Sonnet 4.6 и GPT-5 уже достаточно хороши для этого паттерна в продакшене.
Долгосрочная персональная память. Вместо того чтобы заново привязываться к программе на каждой сессии, репетитор ведёт граф памяти на ученика, охватывающий месяцы. Это улучшает удержание прошлых заблуждений и перенос между навыками, но поднимает планку по защите данных и процедурам удаления (право на стирание по GDPR, родительский доступ по COPPA).
Открытые модели догоняют по узким задачам репетирования. Llama 4 и Mistral Large 3 уже находятся в пределах 10% от моделей переднего края на задачах репетирования с привязкой к программе, и разрыв сокращается. К концу 2027 года ожидайте удвоения доли суверенного облака и on-prem-деплоев.
Предсказательные траектории ученика. Сочетание knowledge tracing с паттернами предсказательного UX, которые мы разбирали в руководстве по SaaS, позволяет ITS предсказывать снижение вовлечённости, вмешиваться заранее и планировать повторения против кривых забывания.
FAQ
Заменит ли интеллектуальная обучающая система учителя?
Нет. Каждая продакшен-ITS, которую мы внедряли, построена вокруг управления со стороны учителя — дашборды, обход модели, метки вмешательства. Метаанализ ВанЛена 2011 года поставил пошаговые ITS на d = 0,76, а репетиторов-людей — на d = 0,79. Выигрыш не в замене, а в масштабировании индивидуальной практики на каждого ученика в классе.
Нельзя ли просто взять ChatGPT с кастомным промптом?
Можно собрать что-то, похожее на репетитора, но устойчивого обучения вы не получите. Молик и Молик (2024) показали: ученики, использовавшие стандартный GPT-4 без защитных контуров, после отключения доступа показали результат на 17% хуже контроля. Вариант с сократическим промптом и привязкой к программе дал +127% прироста, который сохранился. Инженерная разница — это модель ученика, RAG, символьная верификация и контур оценки.
BKT против deep knowledge tracing — с чего начать?
BKT, если у вас меньше 500 тыс. взаимодействий или нужны интерпретируемые дашборды для учителей. SAKT — когда переваливаете за ~1 млн взаимодействий и есть ML-инженер. SAINT — только на масштабах EdNet (>10 млн взаимодействий). Прирост точности от более сложных моделей реален, но мал по сравнению с выигрышем от лучшей привязки к программе и лучших педагогических промптов.
Как не дать репетитору галлюцинировать по математике?
Пропускайте каждый кандидат-ответ через символьный верификатор до показа ученику. SymPy бесплатен и закрывает алгебру и матанализ от K-12 до бакалавриата. Wolfram Alpha добавляет более широкое символьное покрытие. Для курсов с большим объёмом доказательств набирает обороты Lean 4 с тактиками. Один этот паттерн убирает около 95% галлюцинаций в арифметике.
Является ли моя ITS высокорисковой по EU AI Act?
Если она принимает решения о распределении, зачислении или формировании оценок, либо ведёт прокторинг экзаменов — да, Приложение III относит AI в образовании и профессиональной подготовке к высокорисковым. Полные требования (управление рисками, технический файл, контроль человеком, постмаркетинговый мониторинг) становятся обязательными 2 августа 2026. Чисто практические репетиторы с обратной связью, без автоматизированных решений, обычно ограниченного риска — им хватает требований к прозрачности.
Какой реалистичный d Коэна для ITS, которую мы построим?
0,5–0,7 — хорошо инженерно проработанный продакшен-результат. 0,7–0,8 — потолок литературы, достигнутый системами с годами A/B-настройки (MATHia, ASSISTments). Любые заявки на d > 1,0 без десятилетия данных — почти наверняка ошибка измерения или искажение отбора (selection bias).
Как закрыть требования COPPA для учеников K-5?
Срок соответствия обновлению COPPA 2025 года — 22 апреля 2026 — требует подтверждаемого родительского согласия до передачи данных третьим лицам. Запустите процесс управления согласием, проаудируйте аналитический стек на утечки в рекламные сети и пользуйтесь школьно-опосредованным согласием там, где это возможно (путь «школьной авторизации» упрощает юридическую нагрузку для школьных округов K-12).
Работает ли ITS в корпоративном обучении, а не только в K-12?
Да, и часто это проще — чище цели обучения, измеримые бизнес-KPI (выполнение задачи, частота ошибок) и меньше несовершеннолетних, чьи данные нужно защищать. EdTech-стек переносится практически без изменений; меняется учебная программа (рамки компетенций вместо Common Core) и оценивание (симуляция рабочих задач вместо стандартизированных тестов). Наш мини-кейс выше — ровно этот паттерн.
Что почитать дальше
Если это руководство было полезным, следующие подробные разборы Фора Софт читаются естественным продолжением.
EdTech
AI-генератор учебных материалов
Как слой генерации контента сочетается с моделью ученика в ITS.
Аналитика
AI-видеоаналитика для онлайн-обучения
Измерение вовлечённости, отслеживание внимания, интеграция ITS на базе видео.
Предсказательный UX
AI-предсказательный UX для SaaS
Паттерны UX, дополняющие модель ученика и работающие на удержание.
Доступность
AI-доступность в UI/UX-дизайне
Паттерны WCAG 2.2 AA, совместимость со скринридерами, дедлайн ADA Title II.
Итог
Интеллектуальное обучение в 2026 — это инфраструктурная задача из пяти слоёв: модель ученика, отслеживающая освоение навыков; граф учебной программы, определяющий контуры предмета; педагогическая LLM, привязанная RAG и проверенная символьными инструментами; мультимодальный интерфейс, принимающий голос, рукописный ввод и код; и слой оценки, который непрерывно измеряет прирост обученности. Команды, надёжно запускающие все пять, стабильно выходят на d Коэна 0,5–0,7 относительно традиционного обучения и удерживают стоимость ученика ниже 270 ₽/мес. Команды, которые запускают только слой LLM, получают вовлечённость без устойчивого обучения — иногда отрицательное устойчивое обучение — и одновременно проваливают аудиты EU AI Act, ADA и COPPA.
Хорошая новость: эталонный стек устоялся, доказательная база сильна, путь до запуска уложен в 10–14 недель. Плохая: 2 августа 2026 регуляторная планка поднимается. Начинайте сейчас.
Готовы проработать концепцию своей интеллектуальной обучающей системы?
30 минут разговора. Модель ученика, граф программы, требования соответствия, реалистичный бюджет. Без слайдов.

