Интеллектуальные обучающие системы адаптируют стиль преподавания под каждого ученика

Интеллектуальные обучающие системы (intelligent tutoring systems, ITS) в 2026 году — уже не лабораторная диковинка. Они работают на миллионах учеников в Khan Academy, Carnegie Learning, Duolingo и внутри европейских корпоративных платформ обучения, давая измеримый прирост обученности на уровне d = 0,6–0,8. Это руководство показывает, как инженеры Фора Софт реально строят такие системы: пятислойную эталонную архитектуру, ландшафт моделей и knowledge tracing 2026 года, паттерн RAG плюс привязка к учебной программе, матрицу требований, которые становятся обязательными к 2 августа 2026 года, и путь запуска за 10–14 недель.

Ключевые тезисы

  • Объём рынка — 795 млрд ₽, к 2030 году превысит 3 трлн ₽. Только сегмент AI-репетиторов — 206 млрд ₽ в 2026 году с темпом роста около 30% в год. Самый большой сегмент — высшее образование, самый быстрорастущий — корпоративное обучение.
  • Доказательства реальны: d = 0,66–0,79. Работы Кулика и Флетчера, ВанЛена, а также Carnegie Learning показывают: пошаговые ITS вплотную приближаются к индивидуальному репетитору-человеку — но только если у системы есть модель ученика, привязка к программе и сократическое сопровождение. Без этих защитных контуров LLM вредят устойчивому обучению (Mollick & Mollick 2024, PNAS 2025).
  • Knowledge tracing — это позвоночник системы. BKT остаётся самым понятным базовым подходом; SAKT и SAINT (на трансформерах) теперь дают AUC 0,82–0,85 на EdNet и ASSISTments. Выбирайте одну из них — не изобретайте свою модель, если у вас меньше 10 млн взаимодействий.
  • Модели на 2026: Claude Sonnet 4.6 — для сократических рассуждений и диагностики ошибочных представлений, GPT-5 — для математики и кода, Gemini 2.5 Flash — для дешёвых диалогов в большом объёме, Llama 4 на H200/B200 — для on-prem-сценариев с повышенными требованиями к приватности. Гибридная маршрутизация снижает стоимость токенов на 70–85%.
  • Регуляторные требования 2026 года связывают жёстко. EU AI Act, Приложение III (системы высокого риска) — 2 августа 2026 года; обновлённый COPPA — 22 апреля 2026 года; ADA Title II и WCAG 2.2 AA — 24 апреля 2026 года; California CAADCA — 1 января 2026 года; сертификация FERPA уже действует.
  • Стоимость — решённая проблема. Совокупная стоимость LLM на одну обучающую сессию в 2026 году — 0,03–2 ₽, то есть примерно 37–150 ₽ на ученика в год. Реальные деньги уходят на модель ученика, граф программы и соответствие нормативам.

Зачем Фора Софт написала это руководство

Мы профессионально разрабатываем продукты обучения на базе AI. Наша практика e-learning и направление AI-интеграции работают вместе на каждом проекте ITS: интеграция с LMS, инфраструктура видео для живых занятий, распознавание речи, векторные хранилища, инференс модели ученика и скучный, но обязательный каркас соответствия, благодаря которому деплои по EU AI Act, Приложение III, реально проходят аудит.

За последние двенадцать месяцев мы наблюдали три одинаковые ошибки, которые губят проекты ITS: команды прикручивают сырой промпт GPT-5 к странице учебника и называют это «репетитором», запускают модель ученика, которая ничего не отслеживает, либо пропускают привязку к учебной программе — и модель начинает выдумывать несуществующие правила производной. Все три ошибки решаются. В этой статье — то, что реально работает.

Прорабатываете концепцию интеллектуальной обучающей системы?

За 30 минут разговора по телефону или почте мы помогаем определить контуры учебной программы, модели ученика и требований к соответствию.

Позвоните нам → Напишите нам →

Что такое «интеллектуальная обучающая система» в 2026 году

В 2015 году «ITS» означала математический репетитор на правилах с вручную закодированным деревом подсказок. В 2020 — глубокую модель knowledge tracing плюс инструмент авторизации контента. В 2026 году ITS — это пятислойная система: (1) модель ученика, отслеживающая, какими навыками студент действительно овладел, (2) доменный граф учебной программы, определяющий, что и в каком порядке преподаётся, (3) педагогическая модель, решающая «подсказать, спросить, направить или двигаться дальше», (4) мультимодальный интерфейс, принимающий голос, рукописный ввод, код и схемы, и (5) слой оценки, который непрерывно измеряет прирост обученности и питает A/B-эксперименты.

LLM — это один компонент, а не вся система. Репетитор, который состоит только из LLM, обёрнутой педагогическим промптом, — это то, что Молик и Молик (2024) называют «GPT Base»: ученики получают краткосрочный прирост, а затем — при отключении доступа — показывают результат на 17% хуже контрольной группы. Их же вариант «GPT Tutor», с сократическим промптом и привязкой к программе, дал +127% устойчивого прироста, сохраняющегося после отключения доступа. Разница — в остальных четырёх слоях.

Рынок: цифры, формирующие категорию 2026 года

Каждый совет директоров EdTech, которому мы делаем брифинг, начинает с одного и того же вопроса: рынок ещё растёт или уже на пике? Данные 2025–2026 говорят: растёт.

Показатель 2025–2026 Источник
Мировой рынок AI в образовании (2026)795 млрд ₽, с ростом до 3 трлн ₽ к 2030 годуGrand View Research, 2026
Подсегмент AI-репетиторов206 млрд ₽ в 2026 году, 1,3 трлн ₽ к 2033 годуGrand View Research, AI Tutors Market 2026
CAGR 2026–203330,5%Grand View Research, 2026
Еженедельное использование AI школьниками K-12 (декабрь 2024)26% и продолжает расти примерно на 2 п.п. за кварталEdWeek Research Center, 2025
Приоритет AI в корпоративном обучении47% руководителей называют переобучение по AI приоритетом №1 на ближайшие 18 месяцевLinkedIn Workplace Learning Report, 2026
Траектория Khan Academy KhanmigoДоступ на уровне округов, цель — более 1 млн учеников к концу 2026 годаKhan Academy 2026 Roadmap
Carnegie Learning MATHiaБолее 600 тыс. учеников, 2 400+ школ СШАОтчёт Carnegie Learning, 2025
Подписчики Duolingo MaxБолее 500 тыс. платящих (начало 2026)Инвесторский отчёт Duolingo, Q4 2025

Перевод для продуктовых руководителей: рынок вас финансирует, доказательная база достаточно прочна, чтобы выдержать скептическую закупку, а референсные проекты Khan, Carnegie, Duolingo и Squirrel AI дают защитимые бенчмарки. Проекты губит не рыночная конъюнктура, а исполнение.

Пятислойная эталонная архитектура

Любая ITS, которую мы запускали в продакшен, раскладывается на одни и те же пять слоёв. Если хотя бы один из них слаб или отсутствует — именно там первым делом всплывают претензии аудита, жалобы учеников или плоские кривые прироста обученности.

Слой Что делает Технологии 2026 года
1. Модель ученикаОтслеживает освоение каждого навыка во времениBKT, DKT, SAKT, SAINT, AKT
2. Доменный граф / граф программыОписывает навыки, предпосылки, оцениванияNeo4j, онтологии учебных программ, метаданные OER Commons
3. Педагогическая модельРешает: подсказать, спросить, направить, двигаться дальше или вернуть на повторClaude Sonnet 4.6, GPT-5, Gemini 2.5 Pro с RAG и контекстом состояния ученика
4. Мультимодальный интерфейсГолос, рукописный ввод, код, схемы, математические рукописиDeepgram Nova-3, Mathpix, Judge0 / Piston, SymPy, Wolfram Alpha, Lean 4
5. Оценка и аналитикаИзмеряет прирост обученности, запускает A/B, выявляет искажения, ведёт дашбордыStatsig, GrowthBook, CUPED, кастомная психометрика IRT, Metabase

Слой, который команды чаще всего недооценивают, — пятый. Без него нельзя понять, помогает или вредит изменение промпта, а значит каждый деплой превращается в гадание. Мы не запускаем ITS без пайплайна экспериментов с инструментовкой CUPED на первом же дне.

Порядок, выстраданный практикой

Стройте слои в порядке 2 → 5 → 1 → 3 → 4. Сначала граф программы (без него не на что опираться при привязке), потом пайплайн оценки (нужно уметь измерять до того, как начнёте учиться), затем модель ученика (это долгосрочный актив с самым большим рычагом), потом педагогические промпты, и в самом конце — мультимодальный ввод-вывод. Команды, которые стартуют с промпта LLM, а остальные слои прикручивают потом, почти всегда перестраивают модель ученика в течение 90 дней.

Knowledge tracing: тихий центр тяжести

Каждое педагогическое решение системы — какую задачу подать следующей, когда предложить подсказку, когда зафиксировать освоение — опирается на модель ученика. Промахнитесь здесь — и никакая хитрость LLM это не починит. Сделайте правильно — и даже небольшая модель даст прирост d = 0,6+.

Модель Архитектура AUC (EdNet / ASSISTments) Когда подходит
BKTДвухсостоянная скрытая марковская модель на каждый навык0,71–0,76Понятные учительские дашборды, небольшие датасеты
DKTLSTM / GRU по истории взаимодействий0,76–0,82Перенос между навыками, кривые забывания
SAKTТрансформер с self-attention0,81–0,84Объяснимые веса внимания, датасеты среднего размера
SAINTДвунаправленный трансформер с раздельными энкодерами вопроса и ответа0,82–0,85Текущий SOTA на масштабах EdNet (более 10 млн взаимодействий)
AKTВнимание плюс IRT-оценка сложности0,80–0,83Адаптивное оценивание, где важна сложность
Гибрид Transformer×BayesianБэкбон SAINT с байесовским последним слоем0,83–0,86Появился в 2025; точность плюс калиброванная неопределённость

Наша рекомендация по умолчанию: начинайте с BKT, если у вас меньше 500 тыс. взаимодействий, переходите на SAKT в районе 1–5 млн взаимодействий, и двигайтесь к SAINT или гибриду Transformer×Bayesian только после 10 млн взаимодействий и при наличии выделенного ML-инженера, способного следить за дрейфом. Не изобретайте кастомную архитектуру. Литературы накоплено достаточно, а отрыв SAKT от любого собственного решения почти всегда меньше, чем операционные затраты на его поддержку.

Ландшафт LLM в 2026 — какая модель для какой задачи репетитора

Универсального «LLM для репетитора» не существует. Каждый продакшен-деплой, который мы запускали, использует 2–4 модели за роутером, выбираемые по задаче и стоимости. Вот матрица, по которой мы в апреле 2026 года ведём брифинги для клиентов.

Модель Вход, ₽/млн токенов Выход, ₽/млн токенов Когда подходит
Claude Sonnet 4.6225 ₽1 125 ₽Сократический диалог, диагностика заблуждений, качество обратной связи
Claude Haiku 4.575 ₽375 ₽Генерация подсказок, краткие пересказы, диалог в большом объёме
GPT-5187 ₽750 ₽Многошаговая математика, обучение коду, использование инструментов
Gemini 2.5 Pro93 ₽750 ₽Мультимодальный ввод (изображения, схемы, рукописная работа)
Gemini 2.5 Flash5 ₽22 ₽Дешёвый диалог большого объёма, быстрая обратная связь
LearnLM (Google)Бесплатно с Workspace for EducationШколы K-12, уже работающие в Google Classroom
Llama 4 70B / 405B (on-prem)Капитальные затраты (340 ₽/час за H200)Капитальные затратыДеплои с повышенными требованиями к приватности (ЕС, медицина, госсектор)
Mistral Large 3150 ₽450 ₽Европейская суверенная альтернатива, on-prem с квантованием FP8

Типовая политика маршрутизации: Gemini 2.5 Flash берёт на себя 70% простых взаимодействий (повторение, подтверждение, короткая обратная связь), Claude Sonnet 4.6 — 20% сократического диалога, GPT-5 — 8% тяжёлой математики и кода, Gemini 2.5 Pro — 2% мультимодальных задач (рукописная работа или интерпретация схем). Такой микс обычно даёт стоимость LLM на сессию в диапазоне 0,3–1,5 ₽.

Наше мнение

Начинайте любой проект ITS с Claude Sonnet 4.6 как слоя рассуждений и Gemini 2.5 Flash как диалогового слоя по умолчанию — даже если планируете потом мигрировать. Sonnet 4.6 — самый надёжный сократический репетитор из всего, что мы запускали в продакшен: он действительно задаёт наводящие вопросы вместо того, чтобы кидаться к ответу, а это критично, когда цель — устойчивое обучение, а не метрики вовлечённости.

RAG и привязка к программе: брандмауэр против галлюцинаций

Под нагрузкой непривязанная LLM-репетитор начнёт придумывать правдоподобно звучащие, но неверные математические правила, путать исторические события и рекомендовать темы за пределами программы ученика. RAG (retrieval-augmented generation) поверх структурированной базы знаний по учебной программе — это и есть брандмауэр. Он не опционален.

Паттерн, который мы запускаем, выглядит так:

1. Загрузка учебной программы. Разбираете принятые стандарты (Common Core, NGSS, программы AP, европейские рамки результатов обучения, внутренние корпоративные карты компетенций) на структурированные чанки. Каждый чанк помечаете уровнем класса, навыками-предпосылками, уровнем таксономии Блума и примерами заданий.

2. Эмбеддинги. OpenAI text-embedding-3-large (1536 измерений) для англоязычных программ, Gemini Embedding 2 — для многоязычных, Cohere Embed v3 — для деплоев, где важна цена. Храните в Pinecone, Weaviate или Qdrant с фильтрами по метаданным (класс, предмет, код стандарта).

3. Поиск. На каждом ходе репетитора достаёте топ-k (обычно 5–8) наиболее семантически релевантных чанков программы, отфильтрованных по классу ученика и активному узлу навыка из модели ученика.

4. Привязанная генерация. Передаёте LLM найденные чанки, состояние ученика (освоенные и осваиваемые навыки) и педагогическую инструкцию («задай сократический вопрос, не решай»). Требуете цитат с кодами стандартов; отбраковываете ответы, не прошедшие проверку цитирования.

5. Верификация. Для математики и естественных наук прогоняете предлагаемый моделью шаг решения через символьный верификатор (SymPy, Wolfram Alpha или тактики Lean 4 для доказательств). Для кода — запускаете его в песочнице Judge0 или Piston до показа ученику. Один этот шаг убирает около 95% галлюцинаций по математике.

Мультимодальный ввод-вывод: базовый уровень 2026

Ученики не печатают уравнения. Они их пишут. Они не набирают код аккуратно. Они вставляют черновую работу как есть. А требования доступности всё настойчивее предписывают, чтобы каждое задание можно было выполнить хотя бы двумя способами. Ваша ITS 2026 года должна нативно принимать:

Голосовой ввод. Deepgram Nova-3 для потокового распознавания речи в реальном времени (12–15% WER на реальной речи учеников, диаризация говорящих, 40+ языков) или Whisper v3 для on-prem с повышенной приватностью. Голос открывает обучение K-3, поддержку учеников с дислексией и работу без рук. Полный обзор ландшафта ASR мы давали в подробном разборе доступности подкастов — там разобраны компромиссы по ASR.

Рукописный ввод и математическая запись. Mathpix (распознавание математики → LaTeX, точность 95%+ на печатных уравнениях, 85%+ на рукописных) или Google Handwriting Recognition для обычного текста. Mathpix — единственный продакшен-вариант, которому мы доверяем в работе с матанализом и матрицами.

Исполнение кода. Judge0 (SaaS, 70+ языков) для большинства деплоев, Piston (open-source) — когда нужен on-prem. Каждый код, который сдаёт ученик, исполняется в изолированном контейнере до того, как репетитор начнёт его комментировать. Это превращает «у вас синтаксическая ошибка» из предположения в факт.

Математическая верификация. SymPy (open-source, быстрый, покрывает K-12 и алгебру с матанализом для бакалавров), Wolfram Alpha API (более широкое символьное покрытие, 750–2 250 ₽/мес на разработчика), Lean 4 с тактиками для проверки уровня доказательств (всё чаще используется на продвинутых программах CS и математики).

Мультимодальный ввод LLM. GPT-5, Gemini 2.5 Pro и Claude Opus 4.6 принимают изображения в продакшен-качестве. Ученик может сфотографировать доску, загрузить скриншот или вставить схему — и репетитор отвечает на то, что реально видит, а не на пересказ. Паттерны UX для таких сценариев мы разбираем в нашем руководстве по AI-доступности в UI/UX.

Адаптивное оценивание: IRT, CAT и Elo

Теория ответов на задания (item response theory, IRT) — тихая рабочая лошадка серьёзных ITS. 2-PL IRT (сложность плюс дискриминативность) — это нижняя планка; 3-PL IRT добавляет параметр угадывания для тестов с выбором ответа; многомерные модели IRT моделируют сразу несколько латентных навыков. Компьютерное адаптивное тестирование (CAT) использует эти модели, чтобы выбирать следующее задание там, где стандартная ошибка оценки способности минимальна, и достигать той же точности измерения примерно вдвое меньшим числом заданий.

Для небольших платформ (менее ~100 тыс. предъявленных заданий) рейтинговая оценка сложности по Elo проще в эксплуатации и показывает результат в пределах ~5% от полноценного IRT на большинстве реальных задач. Duolingo, DreamBox и Quizlet используют варианты Elo. Начинайте оттуда, а на полный IRT переходите, когда наберёте более 5 млн ответов на задания и наймёте специалиста по тестированию.

Соответствие требованиям: что вступает в силу в 2026

ITS сидит в самом центре регуляторной мишени. Образование, автоматизированные решения и работа с несовершеннолетними наслаивают друг на друга требования, и 2026-й — год, когда несколько из них вступают в полную силу.

Регулирование Охват Дата вступления в силу в 2026 Что требует
EU AI Act, Приложение III (высокий риск)Вся ЕС; ITS, используемые для распределения, оценивания или прокторинга2 августа 2026Система управления рисками, технический файл, контроль со стороны человека, постмаркетинговый мониторинг
GDPR, статья 22Пользователи в ЕС; «исключительно автоматизированные» решения с существенным эффектомДействуетПроверка человеком решений с высокими ставками (распределение, метки вмешательства)
Обновлённый COPPA 2025США, дети младше 13 летСрок соответствия — 22 апреля 2026Подтверждаемое родительское согласие до передачи данных третьим лицам; запрет поведенческой рекламы
FERPAВсе школы K-12 США и вузы, получающие федеральное финансированиеДействует (сертификация штатов подана в 2025)Защита образовательных записей; обязательны соглашения о работе с данными с поставщиками
ADA Title II + WCAG 2.2 AAГосорганы штатов и муниципалитетов США, включая публичные школы24 апреля 2026 (для населения >50 тыс.)Все цифровые инструменты соответствуют WCAG 2.2 AA; принудительное исполнение через жалобы в DOJ
California CAADCA + SOPIPAПользователи в Калифорнии1 января 2026Оценка воздействия на защиту данных для AI с высоким риском, запрет продажи данных
India DPDP ActПользователи в ИндииПоэтапно в 2025–2026Явное согласие, уведомление об инцидентах, DPO для значимых фидуциариев
ISO/IEC 23894 (управление AI-рисками)Добровольный, всё чаще требуется при закупкахДокументированная таксономия рисков, планы обработки, непрерывный пересмотр

Самое крупное изменение 2026 года — классификация по статье 6 и Приложению III EU AI Act. Если ваша ITS даёт рекомендации по распределению, формирует оценки, используемые в решениях, или ведёт прокторинг, она относится к высокорисковым. Закладывайте полный технический файл, документированный контур контроля со стороны человека и план постмаркетингового мониторинга. Пропустите — рискуете остановкой запуска в ЕС.

Наш быстрый путь к соответствию

Мы встраиваем технический файл EU AI Act в инженерный процесс с первой недели: каждое изменение модели ученика, ревизия промпта и обновление датасета пишет запись в журнал соответствия только на дозапись. К 2 августа 2026 у клиента готов полный аудиторский след — а не паническая трёхмесячная гонка по документации.

Экономика стоимости и задержек

Стоимость LLM редко становится узким местом юнит-экономики ITS в 2026 году. Инфраструктура, проверка человеком и подготовка контента стоят кратно больше. Вот разбивка, которой мы пользуемся для типового математического репетитора K-12 на 20 обучающих сессий ученика в месяц.

Компонент Стоимость на ученика в месяц
Токены LLM (гибридная маршрутизация, 20 сессий)7–45 ₽
STT / ASR (голос, ~30 минут в месяц)11–22 ₽
Эмбеддинги и векторное хранение1–3 ₽
API верификации математики и кода3–11 ₽
Инфраструктура (вычисления, хранение, CDN)37–112 ₽
Проверка человеком / QA (выборочно)22–75 ₽
Итого на ученика в месяц84–270 ₽

При цене подписки 750–1 500 ₽/мес или цене места по школьной лицензии 3 750–11 250 ₽/год валовая маржа — 70–90% до распределения затрат на инженерию, соответствие и контент. Экономика сходится; стратегический вопрос — ARPU против объёма, а не себестоимость.

Мини-кейс: европейская корпоративная платформа переобучения запускает ITS за 12 недель

Клиенту Фора Софт в европейской страховой компании потребовалось переобучить около 5 000 специалистов по урегулированию убытков базовой работе с данными на Python в рамках их программы готовности к EU AI Act 2026 года. Классическое аудиторное обучение обошлось им в 1,2 млн € в 2025 году и подняло долю завершивших с 34% до 41%. Нас попросили сделать репетитора, который масштабируется без новых аудиторных часов.

Что мы запустили за 12 недель:

  • Модель ученика: SAKT поверх внутренней карты компетенций по Python (48 навыков, 380 заданий, ~2 000 обучающих взаимодействий из предыдущего пилота).
  • Граф программы: справочник Python.org плюс внутренние стандарты работы с данными, вложены через OpenAI text-embedding-3-large в Weaviate.
  • Педагогика: Claude Sonnet 4.6 с сократическим промптом, привязанный к топ-6 фрагментам программы и текущему вектору освоения ученика; Gemini 2.5 Flash отвечал за повторение, подтверждения и быструю обратную связь.
  • Мультимодальность: ячейки кода в стиле Jupyter исполнялись в Piston (on-prem ради приватности); голосовые вопросы и ответы — через Deepgram Nova-3.
  • Оценка: A/B-тесты вариантов промпта с CUPED на Statsig; пред- и постоценивание с калибровкой сложности по IRT.
  • Соответствие: полный технический файл по статьям 9 и 11 EU AI Act, шаг проверки человеком по GDPR, статья 22, на любую метку «ученик в зоне риска», пройденный аудит доступности WCAG 2.2 AA.

Результаты после 4 месяцев эксплуатации: доля завершивших выросла с 41% до 63% (+22 п.п.), время до освоения сократилось на 31%, стоимость одного завершения упала с 350 € (аудитория) до 58 € (ITS плюс проверка человеком), а DPO клиента подписал технический файл EU AI Act на 11-й неделе.

5 ловушек, убивающих проекты интеллектуального обучения

1. «Да просто промптом подёргаем GPT». Так получают «GPT Base» по Молику — краткосрочная вовлечённость, потом обвал обученности при отключении доступа. Без модели ученика, привязки к программе и сократического сопровождения LLM — это сервис «сделать домашку», а не репетитор.

2. Пропуск символьного верификатора. LLM уверенно ошибаются в арифметике, алгебре и матанализе. Вызов SymPy или Wolfram Alpha до показа ответа ученику — дешёвая страховка. Пропустите — и научите целый поток уверенно считать, что 2/3 + 1/4 = 3/7.

3. Нет пути обхода для учителя. Учителям нужно видеть состояние ученика, иметь возможность не согласиться с ним и вручную сдвинуть ученика вперёд или назад. ITS, которые этого не дают, становятся враждебными учителю — и внедрение умирает.

4. Доступность откладывают на потом. ADA Title II и WCAG 2.2 AA — это новая нижняя планка. Дотягивание доступности задним числом стоит в 3–5 раз дороже, чем встраивание с самого начала, а дедлайн 24 апреля 2026 — жёсткая регуляторная линия, а не ориентир.

5. Полёт вслепую по приросту обученности. Если вы не можете замерить, лучше ли промпт v18 обучает, чем v17, вы гадаете. Инструментованное по CUPED A/B-тестирование на прирост обученности (а не только на вовлечённость) — не опция.

Эвристика по бюджету, которой мы пользуемся

Для среднего проекта ITS (один предмет, 10–50 навыков, 5–50 тыс. учеников) закладывайте 180–400 тыс. € на разработку за 10–14 недель, примерно так: 40% инженерия, 25% учебная программа и контент, 20% соответствие и доступность, 15% оценка и A/B. Кто называет меньше — обычно пропускает модель ученика или соответствие, а за оба потом приходится платить тройную цену. Готовы разобрать строки сметы по телефону или почте.

KPI: что измерять

В долгосроке имеет значение единственный KPI — прирост обученности (нормированный или d Коэна). Метрики вовлечённости могут расти без улучшения обученности и наоборот. Тем не менее, продакшен-ITS обычно отчитывается по такому набору:

  • Нормированный прирост обученности. (посттест% − претест%) / (100 − претест%); цель — >0,40.
  • d Коэна относительно контроля. Цель >0,5 относительно традиционного обучения; потолок в литературе — около 0,8.
  • Доля завершивших. Процент записавшихся, дошедших до освоения целевого набора навыков.
  • Время до освоения. Медианное число минут на навык; должно падать на ~15–30% относительно неадаптивной базы.
  • Калибровка использования подсказок. Доля учеников с 2–4 подсказками на задачу (оптимальная полоса); >5 — сигнал излишней опеки.
  • Уровень галлюцинаций. Доля ответов репетитора, помеченных как ошибочные символьным верификатором или проверяющим человеком; цель <1% для математики K-12.
  • Соответствие доступности. Доля прохождения автоматического и ручного аудита WCAG 2.2 AA; цель — 100%.
  • Использование учительского обхода. Доля потоков, где учитель трогает модель ученика; здоровый диапазон — 10–25%.

Когда НЕ стоит строить ITS своими силами

Не стройте свою ITS, если выполняется хотя бы одно из условий: (а) у вас меньше 1 000 учеников и нет ясной траектории к 10 тыс., (б) программа меняется чаще двух раз в год, (в) в команде нет ML-инженера и нет плана его нанять, (г) для предмета нет символьного верификатора, и вы готовы мириться с уровнем галлюцинаций 5–15%, (д) ваш отдел закупок не вытянет затраты на соответствие EU AI Act, Приложение III. В этих случаях лицензируйте Khanmigo, MATHia, Century Tech или специализированного отраслевого вендора и сосредоточьте инженерную силу на интеграции.

Фреймворк принятия решений — выбор стека за шесть вопросов

Ответьте на эти вопросы до написания первой строки кода:

  1. Какой предмет и класс? Математика и STEM — нужен символьный верификатор; гуманитарные дисциплины — RAG плюс оценка по рубрикам; языки — произношение плюс диалог; кодинг — изолированное исполнение.
  2. Сколько у вас данных о взаимодействиях? <500 тыс. — BKT; 1–10 млн — SAKT; >10 млн — SAINT или гибрид.
  3. Какая юрисдикция? ЕС — закладывайте EU AI Act, Приложение III, с первой недели; США K-12 — COPPA + FERPA + ADA; Калифорния — CAADCA.
  4. Какой профиль приватности? Корпорации, госсектор, медицина — on-prem Llama 4 или Mistral Large 3; потребительский EdTech — API с подписанными соглашениями о данных.
  5. Какие модальности нужны? Голос плюс рукописный ввод плюс код поднимают планку инженерных усилий примерно на 30% относительно только текста.
  6. Какая метрика успеха? Вовлечённость, завершение или прирост обученности? Полный стек оправдан только третьим; первые две часто закрываются более лёгкой адаптивной системой контента.

Хотите пройти этот фреймворк вместе с нами?

30 минут разговора, никакой презентации. На выходе — рекомендация по стеку и реалистичный бюджет.

Позвоните нам → Напишите нам →

Сценарий внедрения: путь за 10–14 недель

Любой проект ITS, который мы ведём, проходит одни и те же фазы. Длительность гнётся под объём, но не под структуру.

Неделя Фаза Результаты
1–2Обследование и охват соответствияГраф программы v0, матрица соответствия, план интеграции с LMS
3–4RAG и эмбеддингиЗаполнена векторная БД, оценка качества поиска, защитные контуры цитирования
5–6Модель ученикаОбучена BKT или SAKT, базовый уровень AUC, подобраны пороги освоения
7–8Педагогика и мультимодальностьРоутер LLM, сократические промпты, подключены STT, рукописная математика, исполнение кода
9–10Оценка и A/BПодключены Statsig / GrowthBook, CUPED, инструментовка прироста обученности
11–12Соответствие и доступностьТехнический файл EU AI Act, аудит WCAG 2.2 AA, подписан FERPA и COPPA
13–14Запуск и подготовка учителейДашборды для учителей, обучение, мониторинг, передача под SLA

Куда движутся ITS в 2026–2027

Агентные репетиторы. Следующая волна — не лучший одиночный промпт, а цикл «планировщик-исполнитель», в котором репетитор ставит цель сессии, выбирает инструменты (поиск, верификатор, песочница кода, рендерер математики) и контролирует прогресс. Claude Sonnet 4.6 и GPT-5 уже достаточно хороши для этого паттерна в продакшене.

Долгосрочная персональная память. Вместо того чтобы заново привязываться к программе на каждой сессии, репетитор ведёт граф памяти на ученика, охватывающий месяцы. Это улучшает удержание прошлых заблуждений и перенос между навыками, но поднимает планку по защите данных и процедурам удаления (право на стирание по GDPR, родительский доступ по COPPA).

Открытые модели догоняют по узким задачам репетирования. Llama 4 и Mistral Large 3 уже находятся в пределах 10% от моделей переднего края на задачах репетирования с привязкой к программе, и разрыв сокращается. К концу 2027 года ожидайте удвоения доли суверенного облака и on-prem-деплоев.

Предсказательные траектории ученика. Сочетание knowledge tracing с паттернами предсказательного UX, которые мы разбирали в руководстве по SaaS, позволяет ITS предсказывать снижение вовлечённости, вмешиваться заранее и планировать повторения против кривых забывания.

FAQ

Заменит ли интеллектуальная обучающая система учителя?

Нет. Каждая продакшен-ITS, которую мы внедряли, построена вокруг управления со стороны учителя — дашборды, обход модели, метки вмешательства. Метаанализ ВанЛена 2011 года поставил пошаговые ITS на d = 0,76, а репетиторов-людей — на d = 0,79. Выигрыш не в замене, а в масштабировании индивидуальной практики на каждого ученика в классе.

Нельзя ли просто взять ChatGPT с кастомным промптом?

Можно собрать что-то, похожее на репетитора, но устойчивого обучения вы не получите. Молик и Молик (2024) показали: ученики, использовавшие стандартный GPT-4 без защитных контуров, после отключения доступа показали результат на 17% хуже контроля. Вариант с сократическим промптом и привязкой к программе дал +127% прироста, который сохранился. Инженерная разница — это модель ученика, RAG, символьная верификация и контур оценки.

BKT против deep knowledge tracing — с чего начать?

BKT, если у вас меньше 500 тыс. взаимодействий или нужны интерпретируемые дашборды для учителей. SAKT — когда переваливаете за ~1 млн взаимодействий и есть ML-инженер. SAINT — только на масштабах EdNet (>10 млн взаимодействий). Прирост точности от более сложных моделей реален, но мал по сравнению с выигрышем от лучшей привязки к программе и лучших педагогических промптов.

Как не дать репетитору галлюцинировать по математике?

Пропускайте каждый кандидат-ответ через символьный верификатор до показа ученику. SymPy бесплатен и закрывает алгебру и матанализ от K-12 до бакалавриата. Wolfram Alpha добавляет более широкое символьное покрытие. Для курсов с большим объёмом доказательств набирает обороты Lean 4 с тактиками. Один этот паттерн убирает около 95% галлюцинаций в арифметике.

Является ли моя ITS высокорисковой по EU AI Act?

Если она принимает решения о распределении, зачислении или формировании оценок, либо ведёт прокторинг экзаменов — да, Приложение III относит AI в образовании и профессиональной подготовке к высокорисковым. Полные требования (управление рисками, технический файл, контроль человеком, постмаркетинговый мониторинг) становятся обязательными 2 августа 2026. Чисто практические репетиторы с обратной связью, без автоматизированных решений, обычно ограниченного риска — им хватает требований к прозрачности.

Какой реалистичный d Коэна для ITS, которую мы построим?

0,5–0,7 — хорошо инженерно проработанный продакшен-результат. 0,7–0,8 — потолок литературы, достигнутый системами с годами A/B-настройки (MATHia, ASSISTments). Любые заявки на d > 1,0 без десятилетия данных — почти наверняка ошибка измерения или искажение отбора (selection bias).

Как закрыть требования COPPA для учеников K-5?

Срок соответствия обновлению COPPA 2025 года — 22 апреля 2026 — требует подтверждаемого родительского согласия до передачи данных третьим лицам. Запустите процесс управления согласием, проаудируйте аналитический стек на утечки в рекламные сети и пользуйтесь школьно-опосредованным согласием там, где это возможно (путь «школьной авторизации» упрощает юридическую нагрузку для школьных округов K-12).

Работает ли ITS в корпоративном обучении, а не только в K-12?

Да, и часто это проще — чище цели обучения, измеримые бизнес-KPI (выполнение задачи, частота ошибок) и меньше несовершеннолетних, чьи данные нужно защищать. EdTech-стек переносится практически без изменений; меняется учебная программа (рамки компетенций вместо Common Core) и оценивание (симуляция рабочих задач вместо стандартизированных тестов). Наш мини-кейс выше — ровно этот паттерн.

Если это руководство было полезным, следующие подробные разборы Фора Софт читаются естественным продолжением.

EdTech

AI-генератор учебных материалов

Как слой генерации контента сочетается с моделью ученика в ITS.

Аналитика

AI-видеоаналитика для онлайн-обучения

Измерение вовлечённости, отслеживание внимания, интеграция ITS на базе видео.

Предсказательный UX

AI-предсказательный UX для SaaS

Паттерны UX, дополняющие модель ученика и работающие на удержание.

Доступность

AI-доступность в UI/UX-дизайне

Паттерны WCAG 2.2 AA, совместимость со скринридерами, дедлайн ADA Title II.

Итог

Интеллектуальное обучение в 2026 — это инфраструктурная задача из пяти слоёв: модель ученика, отслеживающая освоение навыков; граф учебной программы, определяющий контуры предмета; педагогическая LLM, привязанная RAG и проверенная символьными инструментами; мультимодальный интерфейс, принимающий голос, рукописный ввод и код; и слой оценки, который непрерывно измеряет прирост обученности. Команды, надёжно запускающие все пять, стабильно выходят на d Коэна 0,5–0,7 относительно традиционного обучения и удерживают стоимость ученика ниже 270 ₽/мес. Команды, которые запускают только слой LLM, получают вовлечённость без устойчивого обучения — иногда отрицательное устойчивое обучение — и одновременно проваливают аудиты EU AI Act, ADA и COPPA.

Хорошая новость: эталонный стек устоялся, доказательная база сильна, путь до запуска уложен в 10–14 недель. Плохая: 2 августа 2026 регуляторная планка поднимается. Начинайте сейчас.

Готовы проработать концепцию своей интеллектуальной обучающей системы?

30 минут разговора. Модель ученика, граф программы, требования соответствия, реалистичный бюджет. Без слайдов.

Позвоните нам → Напишите нам →

  • Технологии