Интеллектуальные обучающие системы: практическое руководство 2026

Интеллектуальные обучающие системы (intelligent tutoring systems, ITS) в 2026 году — уже не лабораторная диковинка. Они работают с миллионами учеников в Khan Academy, Carnegie Learning, Duolingo и на европейских корпоративных платформах обучения, обеспечивая измеримый прирост результатов на уровне d = 0,6–0,8. Это руководство показывает, как инженеры Форс Софт реально строят такие системы: пятислойную эталонную архитектуру, ландшафт моделей и подходы к отслеживанию знаний (knowledge tracing) 2026 года, паттерн RAG с привязкой к учебной программе, матрицу требований, которые станут обязательными с 2 августа 2026 года, и путь запуска за 10–14 недель.

Ключевые тезисы

Объём рынка — 795 млрд ₽, к 2030 году превысит 3 трлн ₽. Только сегмент AI-репетиторов — 206 млрд ₽ в 2026 году с темпом роста около 30% в год. Самый большой сегмент — высшее образование, самый быстрорастущий — корпоративное обучение.
Доказательства реальны: d = 0,66–0,79. Исследования Кулика и Флетчера, ВанЛена, а также Carnegie Learning показывают: пошаговые системы адаптивного обучения почти не уступают репетитору-человеку — но только при наличии трёх условий: модели ученика, привязки к учебной программе и сократического сопровождения. Без этих элементов LLM вредят устойчивому обучению (Mollick & Mollick 2024, PNAS 2025).
Knowledge tracing — это основа системы. BKT остаётся самым понятным базовым подходом; SAKT и SAINT (на трансформерах) теперь показывают AUC 0,82–0,85 на EdNet и ASSISTments. Выбирайте одну из них — не пишите свою модель, если у вас меньше 10 млн взаимодействий.
Модели на 2026: Claude Sonnet 4.6 — для сократических диалогов и выявления ошибочных представлений, GPT-5 — для математики и программирования, Gemini 2.5 Flash — для дешёвых диалогов в больших объёмах, Llama 4 на H200/B200 — для локальных сценариев с высокими требованиями к приватности. Гибридная маршрутизация снижает стоимость токенов на 70–85%.
Регуляторные требования 2026 года вступают в силу жёстко. EU AI Act, Приложение III (системы высокого риска) — 2 августа 2026 года; обновлённый COPPA — 22 апреля 2026 года; ADA Title II и WCAG 2.2 AA — 24 апреля 2026 года; California CAADCA — 1 января 2026 года; сертификация FERPA уже действует.
Стоимость — решённая проблема. Совокупная стоимость LLM на одну обучающую сессию в 2026 году — 0,03–2 ₽, то есть примерно 37–150 ₽ на ученика в год. Деньги реально уходят на модель ученика, граф программы и соответствие нормативам.

Зачем Фора Софт написала это руководство

Мы профессионально разрабатываем образовательные продукты на основе ИИ. Направления e-learning и интеграции ИИ тесно сотрудничают в каждом проекте ITS: подключение к LMS, инфраструктура для видеотрансляций, распознавание речи, векторные хранилища, анализ поведения ученика и скучный, но обязательный каркас соответствия, благодаря которому деплои по EU AI Act, Приложение III, реально проходят аудит.

За последние двенадцать месяцев мы наблюдали три одинаковые ошибки, которые губят проекты ITS: команды просто подключают сырой промпт GPT-5 к странице учебника и называют это «репетитором», запускают модель, которая не отслеживает прогресс ученика, либо забывают привязать систему к учебной программе — и модель начинает выдумывать несуществующие правила производной. Все три ошибки можно исправить. В этой статье — то, что реально работает.

Прорабатываете концепцию интеллектуальной обучающей системы?

За 30 минут разговора по телефону или почте мы помогаем определить основные направления учебной программы, особенности ученика и требования к его подготовке.

Позвоните нам → Напишите нам →

Что такое «интеллектуальная обучающая система» в 2026 году

В 2015 году «ITS» означала математического репетитора на правилах с вручную закодированным деревом подсказок. В 2020 — глубокую модель knowledge tracing плюс инструмент для создания контента. В 2026 году ITS — это пятислойная система: (1) модель ученика, отслеживающая, какими навыками он действительно овладел, (2) доменный граф учебной программы, определяющий, что и в каком порядке преподаётся, (3) педагогическая модель, решающая: подсказать, спросить, направить или двигаться дальше, (4) мультимодальный интерфейс, принимающий голос, рукописный ввод, код и схемы, и (5) слой оценки, который непрерывно измеряет прирост обученности и питает A/B-эксперименты.

LLM — это один компонент, а не вся система. Репетитор, состоящий только из LLM, обёрнутой в педагогический промпт, — это то, что Молик и Молик (2024) называют «GPT Base»: ученики показывают краткосрочный прирост, но после отключения доступа их результаты оказываются на 17% хуже, чем у контрольной группы. Их же вариант «GPT Tutor» с сократическим промптом и привязкой к учебной программе дал устойчивый прирост на +127%, сохраняющийся даже после отключения доступа. Разница — в остальных четырёх слоях.

Рынок: цифры, формирующие категорию 2026 года

Каждый совет директоров EdTech, которому мы проводим брифинг, начинает с одного и того же вопроса: рынок ещё растёт или уже достиг пика? Данные за 2025–2026 годы показывают: растёт.

Показатель	2025–2026	Источник
Мировой рынок ИИ в образовании (2026)	795 млрд ₽, с ростом до 3 трлн ₽ к 2030 году	Grand View Research, 2026
Подсегмент AI-репетиторов	206 млрд ₽ в 2026 году, 1,3 трлн ₽ к 2033 году	Grand View Research, AI Tutors Market 2026
CAGR 2026–2033	30,5%	Grand View Research, 2026
Еженедельное использование ИИ школьниками K–12 (декабрь 2024)	26% и продолжает расти примерно на 2 п. п. каждый квартал	EdWeek Research Center, 2025
Приоритет AI в корпоративном обучении	47% руководителей считают переобучение по искусственному интеллекту главным приоритетом на ближайшие 18 месяцев	LinkedIn Workplace Learning Report, 2026
Траектория Khan Academy Khanmigo	Доступ на уровне округов, цель — более 1 млн учеников к концу 2026 года	Khan Academy 2026 Roadmap
Carnegie Learning MATHia	Более 600 тыс. учеников, 2 400+ школ США	Отчёт Carnegie Learning, 2025
Подписчики Duolingo Max	Более 500 тыс. платящих (начало 2026)	Инвесторский отчёт Duolingo, Q4 2025

Перевод для продуктовых руководителей: рынок готов финансировать, доказательная база достаточно сильна, чтобы пройти скептическую закупку, а референсные проекты Khan, Carnegie, Duolingo и Squirrel AI дают надёжные бенчмарки. Проекты губит не рыночная конъюнктура, а качество исполнения.

Пятислойная эталонная архитектура

Любая ITS, которую мы запускали в продакшен, строится из одних и тех же пяти слоёв. Если хотя бы один из них оказывается слабым или отсутствует — именно там в первую очередь появляются претензии со стороны аудита, жалобы учеников или отсутствие роста обученности.

Слой	Что делает	Технологии 2026 года
1. Модель ученика	Отслеживает прогресс освоения каждого навыка со временем	BKT, DKT, SAKT, SAINT, AKT
2. Доменный граф / граф программы	Описывает навыки, предпосылки и оценивания	Neo4j, онтологии учебных программ, метаданные OER Commons
3. Педагогическая модель	Решает: подсказать, спросить, направить, продолжить или отправить на повтор	Claude Sonnet 4.6, GPT-5, Gemini 2.5 Pro с RAG и контекстом состояния ученика
4. Мультимодальный интерфейс	Голос, рукописный ввод, код, схемы, математические записи	Deepgram Nova-3, Mathpix, Judge0 / Piston, SymPy, Wolfram Alpha, Lean 4
5. Оценка и аналитика	Измеряет рост обученности, запускает A/B-тесты, выявляет искажения, ведёт дашборды	Statsig, GrowthBook, CUPED, кастомная психометрика IRT, Metabase

Слой, который команды чаще всего недооценивают, — пятый. Без него невозможно понять, помогает или вредит изменение промпта, и каждый деплой превращается в угадывание. Мы не запускаем ITS без пайплайна экспериментов с инструментовкой CUPED уже в первый день.

Порядок, выработанный практикой

Стройте слои в порядке 2 → 5 → 1 → 3 → 4. Сначала создайте граф программы — без него не на что опираться при привязке. Затем реализуйте пайплайн оценки: важно уметь измерять результаты ещё до начала обучения. Далее — модель ученика: это долгосрочный актив с наибольшим влиянием. Потом добавьте педагогические промпты, и в самом конце — мультимодальный ввод и вывод. Команды, которые начинают с промпта LLM, а остальные слои добавляют потом, почти всегда перестраивают модель ученика в течение 90 дней.

Knowledge tracing: тихий центр тяжести

Каждое педагогическое решение системы — какую задачу показать следующей, когда дать подсказку, когда зафиксировать усвоение — строится на модели ученика. Ошибитесь здесь — и никакая хитрость LLM не поможет. Сделайте правильно — и даже небольшая модель даст прирост d = 0,6+.

Модель	Архитектура	AUC (EdNet / ASSISTments)	Когда подходит
BKT	Двухсостоятельная скрытая марковская модель для каждого навыка	0,71–0,76	Понятные дашборды для учителей, небольшие наборы данных
DKT	LSTM / GRU по истории взаимодействий	0,76–0,82	Перенос между навыками, кривые забывания
SAKT	Трансформер с self-attention	0,81–0,84	Объяснимые веса внимания, датасеты среднего размера
SAINT	Двунаправленный трансформер с отдельными энкодерами для вопроса и ответа	0,82–0,85	Текущий SOTA на масштабах EdNet (более 10 млн взаимодействий)
AKT	Внимание плюс IRT-оценка сложности	0,80–0,83	Адаптивное оценивание, где важна сложность
Гибрид Transformer×Bayesian	Бэкбон SAINT с байесовским последним слоем	0,83–0,86	Появился в 2025; точность и калиброванная неопределённость

Наша рекомендация по умолчанию: начинайте с BKT, если у вас меньше 500 тыс. взаимодействий, переходите на SAKT при 1–5 млн взаимодействий, а к SAINT или гибриду Transformer×Bayesian — только после 10 млн взаимодействий и при наличии выделенного ML-инженера, который сможет отслеживать дрейф. Не создавайте собственную архитектуру с нуля. Литературы накоплено достаточно, и преимущество SAKT перед любым кастомным решением почти всегда меньше, чем операционные издержки на его поддержку.

Ландшафт LLM в 2026 — какая модель под какую задачу репетитора

Универсального «LLM для репетитора» не существует. Каждый продакшен-деплой, который мы запускали, использует 2–4 модели за роутером, выбираемые по задаче и стоимости. Вот матрица, по которой мы в апреле 2026 года проводим брифинги для клиентов.

Модель	Вход, ₽/млн токенов	Выход, ₽/млн токенов	Когда подходит
Claude Sonnet 4.6	225 ₽	1 125 ₽	Сократический диалог, диагностика заблуждений, качество обратной связи
Claude Haiku 4.5	75 ₽	375 ₽	Генерация подсказок, краткие пересказы, диалог в большом объёме
GPT-5	187 ₽	750 ₽	Многошаговая математика, обучение программированию, использование инструментов
Gemini 2.5 Pro	93 ₽	750 ₽	Мультимодальный ввод (изображения, схемы, рукописный текст)
Gemini 2.5 Flash	5 ₽	22 ₽	Дешёвый диалог большого объёма, быстрая обратная связь
LearnLM (Google)	Бесплатно с Workspace for Education	—	Школы K–12, уже работающие в Google Classroom
Llama 4 70B / 405B (on-prem)	Капитальные затраты (340 ₽/час за H200)	Капитальные затраты	Деплои с повышенными требованиями к приватности (ЕС, медицина, госсектор)
Mistral Large 3	150 ₽	450 ₽	Европейская суверенная альтернатива, on-prem с квантованием FP8

Типовая политика маршрутизации: Gemini 2.5 Flash обрабатывает 70% простых взаимодействий — повторение, подтверждение, короткая обратная связь; Claude Sonnet 4.6 — 20% сократических диалогов; GPT-5 — 8% сложных задач по математике и программированию; Gemini 2.5 Pro — 2% мультимодальных задач, например, распознавание рукописного текста или интерпретация схем. Такой подход обычно позволяет удерживать стоимость использования LLM на сессию в диапазоне 0,3–1,5 ₽.

Наше мнение

Начинайте любой проект ITS с Claude Sonnet 4.6 как слоя рассуждений и Gemini 2.5 Flash как диалогового слоя по умолчанию — даже если планируете потом мигрировать. Sonnet 4.6 — самый надёжный сократический репетитор из всех, что мы запускали в продакшен: он действительно задаёт наводящие вопросы, а не сразу выдаёт ответ, и это особенно важно, когда цель — устойчивое обучение, а не рост метрик вовлечённости.

RAG и привязка к программе: брандмауэр против галлюцинаций

Под нагрузкой непривязанная LLM-репетитор начнёт придумывать правдоподобные, но неверные математические правила, путать исторические события и предлагать темы, выходящие за рамки учебной программы ученика. RAG (retrieval-augmented generation) поверх структурированной базы знаний по учебной программе — это и есть брандмауэр. Он не опционален.

Паттерн, который мы запускаем, выглядит так:

1. Загрузка учебной программы. Разбиваете принятые стандарты (Common Core, NGSS, программы AP, европейские рамки результатов обучения, внутренние корпоративные карты компетенций) на структурированные блоки. Каждому блоку присваиваете уровень класса, перечисляете необходимые предварительные навыки, указываете уровень по таксономии Блума и приводите примеры заданий.

2. Эмбеддинги. OpenAI text-embedding-3-large (1536 измерений) — для англоязычных программ, Gemini Embedding 2 — для многоязычных, Cohere Embed v3 — когда важна цена. Храните в Pinecone, Weaviate или Qdrant с фильтрами по метаданным: класс, предмет, код стандарта.

3. Поиск. На каждом ходе репетитора выбираются топ-k (обычно 5–8) наиболее семантически релевантных фрагментов программы, отфильтрованных по классу ученика и активному узлу навыка из модели ученика.

4. Привязанная генерация. Передаёте LLM найденные чанки, состояние ученика (освоенные и осваиваемые навыки) и педагогическую инструкцию («задай сократический вопрос, не решай»). Требуете цитаты с кодами стандартов; отбраковываете ответы, если в них нет корректных ссылок на источники.

5. Верификация. Для математики и естественных наук проверяйте предложенный моделью шаг решения с помощью символьного верификатора — например, SymPy, Wolfram Alpha или тактик Lean 4 для доказательств. Для кода запускайте его в песочнице Judge0 или Piston до того, как показать ученику. Этот один шаг устраняет около 95% математических ошибок.

Мультимодальный ввод-вывод: базовый уровень 2026

Ученики не печатают уравнения. Они их пишут от руки. Они не набирают код аккуратно — вставляют черновики как есть. А требования доступности всё настойчивее предписывают: каждое задание должно быть выполнимо хотя бы двумя способами. Ваша ITS 2026 года должна нативно принимать:

Голосовой ввод. Deepgram Nova-3 для потокового распознавания речи в реальном времени (12–15% WER на реальной речи учеников, диаризация говорящих, 40+ языков) или Whisper v3 для on-pret с повышенной приватностью. Голос открывает обучение для детей K–3, поддержку учеников с дислексией и работу без использования рук. Полный обзор ландшафта ASR мы давали в подробном разборе доступности подкастов — там разобраны компромиссы по ASR.

Рукописный ввод и математическая запись. Mathpix (распознавание математики → LaTeX, точность 95%+ на печатных уравнениях, 85%+ на рукописных) или Google Handwriting Recognition для обычного текста. Mathpix — единственный вариант, которому мы доверяем в работе с матанализом и матрицами.

Исполнение кода. Judge0 (SaaS, 70+ языков) используется для большинства деплоев, а Piston (open-source) — когда нужна локальная установка. Каждый код, который сдаёт ученик, запускается в изолированном контейнере ещё до того, как репетитор начнёт его проверять. Это превращает фразу «у вас синтаксическая ошибка» из догадки в точный факт.

Математическая верификация. SymPy (открытый исходный код, быстрый, охватывает школьную математику и алгебру с математическим анализом для бакалавров), Wolfram Alpha API (более широкое символьное покрытие, 750–2 250 ₽/мес на разработчика), Lean 4 с тактиками для проверки уровня доказательств (всё чаще используется в продвинутых программах по информатике и математике).

Мультимодальный ввод LLM. GPT-5, Gemini 2.5 Pro и Claude Opus 4.6 поддерживают изображения в качестве входных данных в продакшене. Ученик может сфотографировать доску, загрузить скриншот или вставить схему — и получить ответ от репетитора на основе того, что он реально видит, а не на пересказе. Паттерны UX для таких сценариев мы разбираем в нашем руководстве по AI-доступности в UI/UX.

Адаптивное оценивание: IRT, CAT и Elo

Теория ответов на задания (item response theory, IRT) — тихая рабочая лошадка серьёзных ITS. 2-PL IRT (сложность плюс дискриминативность) — это минимальная планка; 3-PL IRT добавляет параметр угадывания для тестов с выбором ответа; многомерные модели IRT моделируют сразу несколько латентных навыков. Компьютерное адаптивное тестирование (CAT) использует эти модели, чтобы выбирать следующее задание там, где стандартная ошибка оценки способности минимальна, и достигать той же точности измерения примерно вдвое меньшим числом заданий.

Для небольших платформ (менее ~100 тыс. предъявленных заданий) рейтинговая оценка сложности по Elo проще в использовании и даёт результат, отличный от полноценного IRT, не более чем на ~5% на большинстве реальных задач. Duolingo, DreamBox и Quizlet используют различные варианты Elo. Начните с него, а переходите на полный IRT, когда наберёте более 5 млн ответов на задания и наймёте специалиста по тестированию.

Соответствие требованиям: что вступает в силу в 2026

ITS сидит в самом центре регуляторной мишени. Образование, автоматизированные решения и работа с несовершеннолетними накладывают друг на друга требования, и 2026 год — это момент, когда несколько из них вступают в полную силу.

Регулирование	Охват	Дата вступления в силу — 2026 год	Что требует
EU AI Act, Приложение III (высокий риск)	Вся ЕС; ITS, используемые для распределения, оценивания или прокторинга	2 августа 2026	Система управления рисками, технический файл, контроль со стороны человека, постмаркетинговый мониторинг
GDPR, статья 22	Пользователи в ЕС; «исключительно автоматизированные» решения с существенным эффектом	Действует	Проверка человеком решений с высокими ставками (распределение, метки вмешательства)
Обновлённый COPPA 2025	США, дети младше 13 лет	Срок соответствия — 22 апреля 2026	Подтверждённое родительское согласие перед передачей данных третьим лицам; запрет на поведенческую рекламу
FERPA	Все школы K–12 США и вузы, получающие федеральное финансирование	Действует (сертификация штатов подана в 2025)	Защита образовательных записей; с поставщиками обязательны соглашения о работе с данными
ADA Title II + WCAG 2.2 AA	Госорганы штатов и муниципалитеты США, включая публичные школы	24 апреля 2026 (для населения >50 тыс.)	Все цифровые инструменты соответствуют стандарту WCAG 2.2 на уровне AA; соблюдение обеспечивается через подачу жалоб в DOJ
California CAADCA + SOPIPA	Пользователи в Калифорнии	1 января 2026	Оценка воздействия на защиту данных для ИИ с высоким риском, запрет на продажу данных
India DPDP Act	Пользователи в Индии	Поэтапно в 2025–2026	Явное согласие, уведомление об инцидентах, DPO для значимых фидуциариев
ISO/IEC 23894 (управление рисками искусственного интеллекта)	Добровольный, всё чаще становится обязательным при закупках	—	Документированная таксономия рисков, планы реагирования, постоянный пересмотр

Самое крупное изменение в 2026 году — классификация по статье 6 и Приложению III EU AI Act. Если ваша ITS даёт рекомендации по распределению, формирует оценки, используемые для принятия решений, или проводит прокторинг, она относится к высокорисковым системам. Подготовьте полный технический файл, документированный контроль со стороны человека и план постмаркетингового мониторинга. Игнорируйте — рискуете приостановкой запуска в ЕС.

Наш быстрый путь к соответствию

Мы встраиваем технический файл EU AI Act в инженерный процесс с первой недели: каждое изменение модели ученика, ревизия промпта и обновление датасета записывается в журнал соответствия только на дозапись. К 2 августа 2026 года у клиента будет готов полный аудиторский след — а не паническая трёхмесячная гонка за документацией.

Экономика стоимости и задержек

Стоимость LLM редко становится узким местом юнит-экономики ITS в 2026 году. Инфраструктура, проверка человеком и подготовка контента обходятся в разы дороже. Вот разбивка, которой мы пользуемся для типового математического репетитора K–12 на 20 обучающих сессий ученика в месяц.

Компонент	Стоимость на ученика в месяц
Токены LLM (гибридная маршрутизация, 20 сессий)	7–45 ₽
STT / ASR (голос, ~30 минут в месяц)	11–22 ₽
Эмбеддинги и векторное хранение	1–3 ₽
API верификации математики и кода	3–11 ₽
Инфраструктура (вычисления, хранение, CDN)	37–112 ₽
Проверка человеком / QA (выборочно)	22–75 ₽
Итого на ученика в месяц	84–270 ₽

При цене подписки 750–1 500 ₽/мес или стоимости одного места по школьной лицензии 3 750–11 250 ₽/год валовая маржа составляет 70–90% до учёта затрат на инженерию, соответствие и контент. Экономика работает; ключевой стратегический вопрос — выбор между ростом ARPU и объёмом, а не снижением себестоимости.

Мини-кейс: европейская корпоративная платформа переобучения запускает ITS за 12 недель

Клиенту Фора Софт — европейской страховой компании — потребовалось переобучить около 5 000 специалистов по урегулированию убытков основам работы с данными на Python в рамках программы подготовки к EU AI Act 2026 года. Традиционное обучение в аудитории обошлось компании в 1,2 млн € в 2025 году и повысило долю завершивших обучение с 34% до 41%. Нам поручили создать репетитора, который сможет масштабироваться без привлечения дополнительных аудиторных часов.

Что мы запустили за 12 недель:

Модель ученика: SAKT поверх внутренней карты компетенций по Python (48 навыков, 380 заданий, ~2 000 обучающих взаимодействий из предыдущего пилота).
Граф программы: справочник Python.org плюс внутренние стандарты работы с данными, вложены через OpenAI text-embedding-3-large в Weaviate.
Педагогика: Claude Sonnet 4.6 с сократическим промптом, привязанный к топ-6 фрагментам программы и текущему вектору освоения ученика; Gemini 2.5 Flash отвечал за повторение, подтверждения и быструю обратную связь.
Мультимодальность: ячейки кода в стиле Jupyter исполнялись в Piston (on-rem для обеспечения приватности); голосовые вопросы и ответы — через Deepgram Nova-3.
Оценка: A/B-тесты вариантов промпта с CUPED на Statsig; предварительная и итоговая оценка с калибровкой сложности по IRT.
Соответствие: полный технический файл по статьям 9 и 11 EU AI Act, проверка человеком по статье 22 GDPR для любой метки «ученик в зоне риска», пройденный аудит доступности по WCAG 2.2 AA.

Результаты после 4 месяцев эксплуатации: доля завершивших выросла с 41% до 63% (+22 п.п.), время освоения сократилось на 31%, стоимость одного завершения упала с 350 € (аудитория) до 58 € (ITS плюс проверка человеком), а DPO клиента подписал технический файл EU AI Act на 11-й неделе.

5 ловушек, убивающих проекты интеллектуального обучения

1. «Да просто промптом подёргаем GPT». Так получают «GPT Base» по Молику — кратковременная вовлечённость, потом резкое падение эффективности при отключении доступа. Без модели ученика, привязки к программе и сократического сопровождения LLM — это сервис «сделай за меня домашку», а не репетитор.

2. Пропуск символьного верификатора. LLM часто ошибаются в арифметике, алгебре и математическом анализе. Вызов SymPy или Wolfram Alpha перед показом ответа ученику — простая и недорогая страховка. Пропустите этот шаг — и получите целый поток учеников, уверенно считающих, что 2/3 + 1/4 = 3/7.

3. Нет пути обхода для учителя. Учителям важно видеть прогресс ученика, иметь возможность не согласиться с ним и вручную переместить ученика вперёд или назад. Системы, которые этого не позволяют, становятся неудобными для учителей — и внедрение таких систем проваливается.

4. Доступность откладывают на потом. ADA Title II и WCAG 2.2 AA — это теперь минимальные требования. Исправлять доступность позже обходится в 3–5 раз дороже, чем закладывать её с самого начала. Дедлайн — 24 апреля 2026 года — это жёсткий регуляторный срок, а не ориентир.

5. Полёт вслепую по приросту обученности. Если вы не можете измерить, лучше ли промпт v18 обучает, чем v17, вы действуете наугад. Инструментированное по CUPED A/Б-тестирование на прирост обученности (а не только на вовлечённость) — не опция.

Эвристика по бюджету, которой мы пользуемся

Для среднего проекта ITS (один предмет, 10–50 навыков, 5–50 тыс. учеников) закладывайте 180–400 тыс. € на разработку за 10–14 недель, примерно так: 40% — инженерия, 25% — учебная программа и контент, 20% — соответствие и доступность, 15% — оценка и A/B-тестирование. Кто называет меньшую сумму — обычно пропускает модель ученика или требования к соответствию, а потом приходится доплачивать втрое. Готовы разобрать детали сметы по телефону или почте.

KPI: что измерять

В долгосрочной перспективе важен только один KPI — прирост обученности (нормированный или d Коэна). Метрики вовлечённости могут расти без улучшения обученности и наоборот. Тем не менее, продакшен-ITS обычно отчитывается по такому набору:

Нормированный прирост обученности. (посттест% − претест%) / (100 − претест%); цель — >0,40.
d Коэна относительно контроля. Цель — больше 0,5 по сравнению с традиционным обучением; максимальный показатель в литературе — около 0,8.
Доля завершивших. Процент записавшихся, которые прошли обучение и освоили целевой набор навыков.
Время до освоения. Медианное время в минутах на освоение навыка; должно снижаться на ~15–30% по сравнению с неадаптивной версией.
Калибровка использования подсказок. Доля учеников, использующих 2–4 подсказки на задачу (оптимальный диапазон); более 5 — сигнал излишней опеки.
Уровень галлюцинаций. Доля ответов репетитора, признанных ошибочными символьным верификатором или человеком-проверяющим; цель — менее 1% для математики K–12.
Соответствие доступности. Доля успешного прохождения автоматического и ручного аудита по стандарту WCAG 2.2 AA; цель — 100%.
Использование учительского обхода. Доля потоков, где учитель корректирует модель ученика; здоровый диапазон — 10–25%.

Когда НЕ стоит строить ITS своими силами

Не стройте свою ITS, если выполняется хотя бы одно из условий: (а) у вас меньше 1 000 учеников и нет чёткого пути к 10 000, (б) программа обновляется чаще двух раз в год, (в) в команде нет ML-инженера и нет планов его нанять, (г) для предмета отсутствует символьный верификатор, и вы готовы терпеть уровень галлюцинаций 5–15%, (д) ваш отдел закупок не справится с затратами на соответствие EU AI Act, Приложение III. В таких случаях лучше лицензировать Khanmigo, MATHia, Century Tech или специализированного отраслевого вендора и направить инженерные ресурсы на интеграцию.

Фреймворк принятия решений — выбор стека за шесть вопросов

Ответьте на эти вопросы до написания первой строки кода:

Какой предмет и класс? Математика и STEM — нужен символьный верификатор; гуманитарные дисциплины — RAG плюс оценка по рубрикам; языки — произношение и диалог; кодинг — изолированное выполнение.
Сколько у вас данных о взаимодействиях? <500 тыс. — BKT; 1–10 млн — SAKT; >10 млн — SAINT или гибрид.
Какая юрисдикция? ЕС — закладывайте EU AI Act, Приложение III, с первой недели; США K-12 — COPPA + FERPA + ADA; Калифорния — CAADCA.
Какой профиль приватности? Корпорации, госсектор, медицина — on-prem Llama 4 или Mistral Large 3; потребительский EdTech — API с подписанными соглашениями о данных.
Какие модальности нужны? Голос, рукописный ввод и код повышают объём инженерных работ примерно на 30% по сравнению с использованием только текста.
Какая метрика успеха? Вовлечённость, завершение курса или рост знаний? Полный стек оправдан только в случае роста знаний; первые две задачи часто решаются более простой адаптивной системой контента.

Хотите пройти этот фреймворк вместе с нами?

30 минут разговора, без презентации. На выходе — рекомендация по стеку и реалистичный бюджет.

Позвоните нам → Напишите нам →

Сценарий внедрения: путь за 10–14 недель

Любой проект ITS, который мы реализуем, проходит одни и те же этапы. Продолжительность зависит от объёма, но не от структуры.

Неделя	Фаза	Результаты
1–2	Обследование и охват соответствия	Граф программы v0, матрица соответствия, план интеграции с LMS
3–4	RAG и эмбеддинги	Заполнена векторная БД, оценено качество поиска, настроены защитные контуры цитирования
5–6	Модель ученика	Обучена BKT или SAKT, базовый уровень AUC, подобраны пороги освоения
7–8	Педагогика и мультимодальность	Роутер LLM, сократические промпты, подключены STT, рукописная математика, исполнение кода
9–10	Оценка и A/B	Подключены Statsig / GrowthBook, CUPED, инструменты для измерения прироста обученности
11–12	Соответствие и доступность	Технический файл EU AI Act, аудит WCAG 2.2 AA, подписан FERPA и COPPA
13–14	Запуск и подготовка учителей	Дашборды для учителей, обучение, мониторинг, передача под SLA

Куда движутся ITS в 2026–2027

Агентные репетиторы. Следующая волна — не просто хороший промпт, а цикл «планировщик-исполнитель», в котором репетитор ставит цель на сессию, выбирает инструменты (поиск, верификатор, песочница кода, рендерер математики) и отслеживает прогресс. Claude Sonnet 4.6 и GPT-5 уже достаточно сильны, чтобы использовать такой подход в реальных условиях.

Долгосрочная персональная память. Вместо того чтобы каждый раз заново адаптироваться к программе, репетитор ведёт для ученика персональный график памяти, охватывающий несколько месяцев. Это помогает лучше запоминать прошлые ошибки и переносить навыки между темами, но требует более строгих мер защиты данных и чётких процедур удаления (например, право на стирание по GDPR и родительский доступ по COPPA).

Открытые модели приближаются к лучшим по узким задачам репетирования. Llama 4 и Mistral Large 3 уже находятся в пределах 10% от передовых моделей на задачах репетирования с привязкой к программе, и разрыв продолжает сокращаться. К концу 2027 года ожидается удвоение доли суверенного облака и развёртываний на собственных серверах.

Предсказательные траектории ученика. Сочетание knowledge tracing с паттернами предсказательного UX, которые мы рассматривали в руководстве по SaaS, позволяет системе ITS заранее выявлять снижение вовлечённости, вовремя вмешиваться и планировать повторения, чтобы противостоять кривой забывания.

FAQ

Заменит ли интеллектуальная обучающая система учителя?

Нет. Каждая продакшен-ITS, которую мы внедряли, построена вокруг управления со стороны учителя — дашборды, обход модели, метки вмешательства. Метаанализ ВанЛена 2011 года поставил пошаговые ITS на d = 0,76, а репетиторов-людей — на d = 0,79. Выигрыш не в замене, а в масштабировании индивидуальной практики на каждого ученика в классе.

Нельзя ли просто взять ChatGPT с кастомным промптом?

Можно собрать что-то похожее на репетитора, но устойчивого обучения не добиться. Молик и Молик (2024) показали: ученики, использовавшие стандартный GPT-4 без защитных механизмов, после отключения доступа показали результат на 17% хуже контрольной группы. Вариант с сократическим промптом и привязкой к учебной программе дал прирост на 127%, который сохранился. Инженерная разница — это модель ученика, RAG, символьная верификация и контур оценки.

BKT против deep knowledge tracing — с чего начать?

BKT — если у вас меньше 500 тыс. взаимодействий или нужны понятные дашборды для учителей. SAKT — когда взаимодействий больше ~1 млн и в команде есть ML-инженер. SAINT — только на масштабах EdNet (более 10 млн взаимодействий). Прирост точности от более сложных моделей действительно есть, но он небольшой по сравнению с выгодой от хорошей привязки к учебной программе и качественных педагогических промптов.

Как не дать репетитору «галлюцинировать» по математике?

Пропускайте каждый кандидат-ответ через символьный верификатор до показа ученику. SymPy бесплатен и покрывает алгебру и матанализ от начальной школы до бакалавриата. Wolfram Alpha обеспечивает более широкое символьное покрытие. Для курсов с большим количеством доказательств набирает популярность Lean 4 с тактиками. Этот один паттерн устраняет около 95% ошибок в арифметике.

Является ли моя ITS высокорисковой по EU AI Act?

Если она принимает решения о распределении, зачислении или выставлении оценок, либо проводит прокторинг экзаменов — да, Приложение III относит использование ИИ в образовании и профессиональной подготовке к высокорисковым. Полные требования (управление рисками, технический файл, контроль человеком, постмаркетинговый мониторинг) станут обязательными с 2 августа 2026 года. Чисто практические репетиторы с обратной связью, не использующие автоматизированные решения, обычно относятся к категории ограниченного риска — им достаточно соблюдения требований к прозрачности.

Какой реалистичный d Коэна для ITS, которую мы построим?

0,5–0,7 — хороший результат, полученный с помощью качественной инженерной проработки в продакшене. 0,7–0,8 — предел, достигнутый в научных работах системами с многолетней настройкой через A/B-тесты (MATHia, ASSISTments). Любые утверждения о d > 1,0 без десятилетий данных почти наверняка связаны с ошибкой измерения или искажением выборки (selection bias).

Как закрыть требования COPPA для учеников K–5?

Срок соответствия обновлению COPPA 2025 года — 22 апреля 2026 — требует подтверждённого родительского согласия перед передачей данных третьим лицам. Запустите процесс управления согласием, проверьте аналитический стек на утечки в рекламные сети и используйте школьное посредничество там, где это возможно (путь «школьной авторизации» упрощает юридическую нагрузку для школьных округов K–12).

Работает ли ITS в корпоративном обучении, а не только в K–12?

Да, и часто это проще — чёткие цели обучения, измеримые бизнес-показатели (выполнение задач, частота ошибок) и меньше несовершеннолетних, чьи данные нужно защищать. EdTech-стек переносится практически без изменений: меняется учебная программа (рамки компетенций вместо Common Core) и система оценивания (симуляция рабочих задач вместо стандартизированных тестов). Наш мини-кейс выше — именно такой пример.

Что почитать дальше

Если это руководство было полезным, следующие подробные разборы Фора Софт станут естественным продолжением.

EdTech

AI-генератор учебных материалов

Как слой генерации контента сочетается с моделью ученика в ITS.

Аналитика

AI-видеоаналитика для онлайн-обучения

Измерение вовлечённости, отслеживание внимания, интеграция ITS на базе видео.

Предсказательный UX

AI-предсказательный UX для SaaS

Паттерны UX, дополняющие модель ученика и повышающие удержание.

Доступность

AI-доступность в UI/UX-дизайне

Паттерны WCAG 2.2 AA, совместимость со скринридерами, дедлайн ADA Title II.

Итог

Интеллектуальное обучение в 2026 году — это инфраструктурная задача из пяти слоёв: модель ученика, отслеживающая освоение навыков; граф учебной программы, определяющий структуру предмета; педагогическая LLM, подключённая к RAG и проверенная с помощью символьных инструментов; мультимодальный интерфейс, принимающий голос, рукописный ввод и код; и слой оценки, который непрерывно измеряет прогресс в обучении. Команды, которые надёжно запускают все пять слоёв, стабильно достигают эффекта d Коэна 0,5–0,7 по сравнению с традиционным обучением и удерживают стоимость на уровне ниже 270 ₽ в месяц. Команды, использующие только слой LLM, получают высокую вовлечённость, но не устойчивое обучение — иногда даже негативный эффект — и одновременно проваливают проверки по EU AI Act, ADA и COPPA.

Хорошая новость: эталонный стек устоялся, доказательная база сильная, путь до запуска укладывается в 10–14 недель. Плохая: 2 августа 2026 года регуляторная планка поднимается. Начинайте сейчас.

Готовы проработать концепцию своей интеллектуальной обучающей системы?

30 минут разговора. Модель ученика, граф программы, требования соответствия, реалистичный бюджет. Без слайдов.

Позвоните нам → Напишите нам →

Технологии

Показатель	Цифра за 2025	Что это значит для вас
Выручка мобильных приложений с генеративным ИИ	225 млрд ₽, +273% год к году	Самостоятельное AI-приложение теперь — полноценный продукт, а не просто функция.
Время в приложениях с генеративным ИИ	48 млрд часов (×3,6 к 2024)	Привычка у пользователей сформировалась — ассистенты теперь конкурируют с вашим приложением за время сессии.
Внедрение разработчиками	63% выпускают не менее одной AI-функции	Не выпускать ИИ в 2026 году — это уже конкурентное отставание, а не нейтральный выбор.
Прирост вовлечённости от персонализации	+62% вовлечённости, +80% конверсии	Одни только AI-рекомендации влияют на финансовый результат.
Пользователи мобильных AI-ассистентов (США)	200 млн+ (110 млн — только на мобильных)	Пользователи ожидают, что голосовой и текстовый ИИ будет работать везде.
Прогноз Gartner	Использование мобильных приложений снизится на 25% к 2027 году (из-за AI-ассистентов)	Приложения без встроенного ИИ будут терять пользователей в пользу системных ассистентов.

Фреймворк / API	Платформа	Лучше всего для	Типичная задержка	Структура затрат
Core ML	iOS, macOS, watchOS	Зрение и NLP на устройстве с Apple Neural Engine	< 100 мс	Разовая, внутри приложения
Apple Foundation Models	iOS 18+, macOS 15+	LLM на устройстве, резюмирование, инструменты письма	< 500 мс	Бесплатно (в составе ОС)
TensorFlow Lite / LiteRT	Android, iOS, Web	Кроссплатформенное ML на устройстве	< 200 мс	Разовая, внутри приложения
MediaPipe	Android, iOS, Web	Поза, руки, лицо, жесты, сегментация	< 100 мс	Разовая, внутри приложения
ML Kit (Google)	Android, iOS	Распознавание текста, штрихкоды, перевод, обнаружение лиц	50 мс–2 с	Бесплатный тариф + оплата за запрос
Gemini Nano (AICore)	Android (Pixel 9+, S26+)	LLM на устройстве, резюмирование, подсказки ответов	< 1 с	Бесплатно (в составе ОС)
ONNX Runtime Mobile	Android, iOS, Web	Переносимые модели между фреймворками	< 300 мс	Разовая, внутри приложения
OpenAI API (GPT-5)	Облако	Рассуждения, код и зрение уровня state-of-the-art	1–3 с	93,75–750 ₽ за 1 млн токенов
Anthropic Claude API	Облако	Рассуждения с длинным контекстом, анализ, код	1–3 с	75–1 875 ₽ / 1 млн токенов (скидка 50% при батч-обработке)
Google Gemini API	Облако	Мультимодальность, экономичный текст и зрение	1–2 с	6–375 ₽ / 1 млн токенов
AWS Rekognition	Облако	Анализ изображений и видео, модерация	500 мс–2 с	0,075–0,9 ₽ за изображение
Azure Cognitive Services	Облако	Корпоративное видение, стиль общения, язык	500 мс–2 с	За запрос + подписка

Объём	Пример функции	Сроки	Ориентировочная стоимость
Одна функция на устройстве	Сканирование документа + OCR	4–8 недель	2–6 млн ₽
Гибрид среднего размера	Зрение на устройстве + облачный LLM-чат	8–14 недель	6–13,5 млн ₽
Полноценный гибрид под продакшн	Оркестрация нескольких моделей, RAG, мониторинг	14–22 недели	11,2–22,5 млн ₽
Корпоративная платформа	Регулируемая отрасль (здравоохранение / финтех), несколько регионов, SLA	22+ недели	от 22,5 млн ₽

Платформа	Для чего лучше всего	Стартовая цена	Нужна гарнитура?
ClassVR	Школа (K–12), более 1 500 сценариев по учебной программе	от 75 000 ₽ за школьный комплект	Да (гарнитуры в комплекте)
Labster	Лаборатории биологии, химии, физики в вузах	5 925–8 175 ₽ за студента в год	Нет (браузер + опционально VR)
Nearpod (с VR)	Встраивание в уроки в школе	11 925–29 775 ₽ в год на преподавателя	Опционально
zSpace	AR/VR без гарнитуры; более 3 500 округов	По запросу (фирменное оборудование)	Нет (очки + дисплей с трекингом)
Prisms VR	Математика и естественные науки, 140 округов	По запросу (лицензия округа)	Да
Engage / Spatial	Совместные классы в высшем образовании	37 500–150 000 ₽ в год за помещение	Да (несколько устройств)
CoSpaces Edu	VR-проекты, которые создают сами ученики	75–225 ₽ за ученика в год	Опционально
Osso VR / FundamentalVR	Хирургическая подготовка	450 000–3 млн ₽ в год за рабочее место	Да

Статья расходов	Год 1	Год 2 и далее
30 × Meta Quest 3S (комплект за 37 500 ₽)	1 125 000 ₽	0 ₽ (обновление раз в 3–4 года)
Контент-платформа (ClassVR / Nearpod)	150 000–375 000 ₽	150 000–375 000 ₽
Обучение преподавателей (1 день)	112 500–225 000 ₽	Обновление: 37 500 ₽/год
Зарядная станция + MDM	112 500–187 500 ₽	0 ₽
Страховка / поломки (10%)	112 500 ₽	112 500 ₽
Итого	1,6–2 млн ₽	300 000–525 000 ₽

Интеллектуальные обучающие системы: практическое руководство 2026

Зачем Фора Софт написала это руководство

Что такое «интеллектуальная обучающая система» в 2026 году

Рынок: цифры, формирующие категорию 2026 года

Пятислойная эталонная архитектура

Knowledge tracing: тихий центр тяжести

Ландшафт LLM в 2026 — какая модель под какую задачу репетитора

RAG и привязка к программе: брандмауэр против галлюцинаций

Мультимодальный ввод-вывод: базовый уровень 2026

Адаптивное оценивание: IRT, CAT и Elo

Соответствие требованиям: что вступает в силу в 2026

Экономика стоимости и задержек

Мини-кейс: европейская корпоративная платформа переобучения запускает ITS за 12 недель

5 ловушек, убивающих проекты интеллектуального обучения

KPI: что измерять

Когда НЕ стоит строить ITS своими силами

Фреймворк принятия решений — выбор стека за шесть вопросов

Сценарий внедрения: путь за 10–14 недель

Куда движутся ITS в 2026–2027

FAQ

Что почитать дальше

Итог

Похожие статьи

Хотите обсудить ваш проект?