
Ключевые выводы
- AI в образовании — это рынок объёмом 525–622 млрд ₽ в 2025 году, который растёт на 31% в год (CAGR) вплоть до 2030 года. Сегмент адаптивного обучения сейчас оценивается в 190 млрд ₽ и достигнет 911 млрд ₽ к 2035 году. Категория перестала быть экспериментальной — это уже инфраструктура.
- AI-платформа для учебных материалов уровня 2026 года состоит из пяти обязательных слоёв: загрузка контента (PDF + видео), генерация с опорой на RAG, педагогический движок, цикл оценки, контроль со стороны преподавателя. Пропустите хотя бы один — и продукт не выживет в продакшене.
- Claude Sonnet 4.6 (225/1125 ₽ за MTok, контекст 1M) и Gemini 2.5 Pro (93–187/375–750 ₽, контекст 2M) доминируют в сценарии работы с большими учебниками в 2026 году. GPT-4.1 лидирует в мультимодальных задачах. Все три модели требуют реранкера и иерархического чанкинга, чтобы выдерживать реальные учебные курсы.
- Соответствие требованиям — стена, об которую разбиваются большинство проектов: FERPA, COPPA (ключевое правило вступает в силу в апреле 2026), GDPR, EU AI Act статья 6 (высокий риск), WCAG 2.2 AA. Передавайте внешним API только обезличенные прокси-данные — иначе ждите письма от регулятора.
- Уровень галлюцинаций фронтирных моделей по-прежнему составляет 10–20% на задачах фактического воспроизведения. С контуром QA "человек в цикле" исследования тьюторинга Стэнфордского периода показывают падение до 0,1%. Обойти контур проверки преподавателем не получится.
- Фора Софт создаёт AI-платформы для обучения по схеме 10–14 недель: 2–3 недели discovery + аудит контента, 2 недели на настройку RAG, 3–4 недели на запуск AI-функций, 2 недели на чат и голосового тьютора, 1–2 недели на интеграцию LTI 1.3, 1–2 недели на пилот и проверку соответствия, 1 неделя на закаливание для продакшена.
Почему Фора Софт написала этот гайд
Мы 20 лет выпускаем видеоплатформы и последние восемь — внедряем AI поверх них. Значительная часть этой работы — образование: виртуальные классы, системы записи лекций, корпоративные L&D-порталы, инструменты адаптивного тьюторинга. Поэтому когда основатели приходят к нам с задачей "построить AI-генератор учебных материалов", мы уже знаем, где минное поле: галлюцинации в математических ответах, нарушения FERPA, прячущиеся в логировании, чанки учебников, по которым находятся нерелевантные абзацы, и преподаватели, у которых ноль видимости в том, что AI наговорил их студентам.
Этот гайд — внутренний бриф, который мы выдаём нашим инженерам на старте проекта. В нём — рынок, эталонная архитектура, педагогический стек, матрица вендоров, контур требований по соответствию и путь в 10–14 недель, по которому мы выпускаем продукт для образовательного учреждения. Без вендорского хайпа и маркетинговых текстов — только решения, которые мы принимаем, и причины, по которым мы их принимаем. Цель: помочь вам дойти до 14-й недели с работающей платформой, а не с горой переделок.
Мы написали этот гайд ещё и потому, что инструментарий 2026 года кардинально отличается от 2024-го. Контекстные окна в 1–2M токенов переопределяют возможности заземления на длинные учебники. Голосовые агенты пробивают порог в 300 мс на полный круг — а значит, настоящий разговорный тьюторинг стал фичей продукта, а не демо. Наша собственная практика agent engineering — внутренний инструментарий и AI-усиленный процесс разработки, который мы разворачиваем на каждом проекте — сокращает время выпуска платформы для учебных материалов примерно на 40% по сравнению с нашими базовыми показателями 2024 года.
Запускаете AI-платформу для обучения в ближайшие два квартала?
Мы пройдёмся по вашей дорожной карте, проверим RAG и контур соответствия требованиям и вернём рекомендацию по архитектуре — бесплатно.
Что такое "AI-генератор учебных материалов" в 2026 году
Этот ярлык объединяет четыре отдельных продуктовых категории, которые в 2022 году существовали порознь:
- Генератор флешкарт и квизов. Загружаете заметки или PDF — получаете флешкарты для интервального повторения и тренировочные тесты. Quizlet Magic Notes, Brainly, StudyFetch, Revisely — каждый по 750–1500 ₽/мес для B2C.
- Разговорный тьютор. Голос плюс текст с задержкой меньше секунды, заземлённый на учебные материалы. Khanmigo (300 ₽/мес со студента), Duolingo Max, инструменты по школьной лицензии.
- Движок понимания контента. Резюмирует учебники, разбирает лекции, отвечает на вопросы по программе. Google NotebookLM (бесплатно + Plus за 1500 ₽/мес), ChatPDF, Humata.
- Институциональная платформа адаптивного обучения. Встраивается через LTI 1.3 в Canvas, Moodle, Blackboard. Персонализированные траектории обучения, дашборды для преподавателей, синхронизация с SIS. Per-seat лицензирование по 150–600 ₽/студент/мес.
Победившая форма продукта в 2026 году объединяет все четыре. Серьёзная платформа позволяет студенту загрузить учебник по биологии, получить автогенерированные оглавления глав, прорешать MCQ с дистракторами, ранжированными по правдоподобности, поговорить с голосовым тьютором, который ссылается на номера страниц, и повторять материал через интервальное повторение — а преподаватель видит дашборд с тем, что сказал AI и как ответили студенты.
Рынок: цифры, которые двигают категорию
Рынок AI в образовании растёт быстрее почти любого другого AI-сабсектора, который мы отслеживаем. Вот что видит покупающая сторона.
| Сегмент | Объём 2025 | Рост | Что двигает |
|---|---|---|---|
| AI в образовании (мир) | 525–622 млрд ₽ | CAGR 31,2% до 2030 | Персонализация обучения, продуктивность учителей |
| Адаптивное обучение | 190 млрд ₽ | CAGR 16,9% до 2035 → 911 млрд ₽ | Высшее образование 44%, K-12 36% |
| EdTech (всего, для сравнения) | 30 трлн ₽+ | Прогноз HolonIQ 2025 | AI ~2% от целого, быстрорастущий кусок |
| AI-инструменты для корпоративного L&D | 82–112 млрд ₽ | CAGR ~28% | Комплаенс, онбординг, апскиллинг |
| Внедрение AI-тьюторов в K-12 | 69% учителей используют генеративный AI | Лидирует старшая школа | Планирование уроков, дифференциация |
Два момента. Первый: CAGR 31% — это не норма даже для AI-сабсектора. Его разгоняет столкновение двух сил: пост-пандемийная цифровизация образовательных институтов не замедлилась, а LLM сделали персонализацию достаточно дешёвой, чтобы пробовать её в масштабе. Второй: кривые внедрения сильно смещены к старшей школе и высшему образованию. Начальная школа в K-12 движется медленнее — из-за ограничений COPPA и нагрузки на обучение учителей.
Эталонный стек из пяти слоёв
Любая AI-платформа для обучения, которую мы строим, раскладывается на эти пять слоёв. Нижние три — это инфраструктура; верхние два — это сам продукт.
| Слой | Что делает | Вендоры по умолчанию (2026) |
|---|---|---|
| 1. Загрузка контента | PDF, видео, лекции, слайды, заметки → нормализованный текст + эмбеддинги | Deepgram Nova-3 (видео), LlamaParse / Unstructured (PDF), OCR-фолбэк (Google Doc AI) |
| 2. Заземление знаний (RAG) | Иерархический чанкинг, векторное хранилище, гибридный поиск, реранкер | Pinecone или Qdrant, Cohere Rerank 3 или Voyage AI rerank |
| 3. Движок генерации | LLM, который выпускает флешкарты, квизы, резюме и реплики в чате — заземлённые на найденный контекст | Claude Sonnet 4.6 (по умолчанию), Gemini 2.5 Pro (длинные учебники), GPT-4.1 (мультимодальные) |
| 4. Педагогический движок | Маппинг по таксономии Блума, планировщик FSRS, трекинг мастерства, ветвление по сложности | Кастом поверх TypeScript/Python; open-source-реализации FSRS |
| 5. Доставка + контроль | UI студента, голосовой агент, дашборд преподавателя, встраивание в LMS, аналитика | Next.js + React, Deepgram Voice Agent, LTI 1.3, Amplitude |
Наше мнение. Слой, на котором гибнет большинство проектов, — это не LLM, а слой 2. Команды думают, что поиск "просто работает", используют наивные 512-токенные чанки и выкатывают тьютора, который уверенно выдумывает факты, потому что найденный контекст оказался нерелевантным. Pinecone плюс Cohere Rerank 3 поверх иерархически разбитого контента — это минимально жизнеспособный RAG для образовательного продукта. Меньше — и вы будете тушить пожары галлюцинаций месяцами после запуска.
Ландшафт LLM: какая модель для какой задачи
Правильная модель — та, что попадает в вашу тематику, контекстное окно и экономику на студента. Вот четыре, к которым мы тянемся.
| Модель | Цена (вход / выход за MTok) | Контекст | Под какие задачи |
|---|---|---|---|
| Claude Sonnet 4.6 | 225 / 1 125 ₽ | 1M токенов | По умолчанию. Сильное рассуждение + промпты, заточенные под педагогику; генератор квизов, которому мы доверяем |
| Claude Opus 4.6 | 375 / 1 875 ₽ (Fast Mode 2 250 / 11 250 ₽) | 1M токенов | Генерация с высокой ставкой: подготовка к board-экзаменам, дисциплины уровня магистратуры, обзоры исследований |
| Gemini 2.5 Pro | 93–187 / 375–750 ₽ | 2M токенов | Заземление на целый учебник в одном вызове; самый дешёвый тариф на входной токен |
| GPT-4.1 | 150 / 600 ₽ (−75% кэш) | 1M токенов | Мультимодальность: диаграммы, рукописные заметки, STEM-материалы с большим количеством графиков |
В продакшене мы обычно держим две модели. Дешёвая быстрая (Sonnet 4.6 или Gemini 2.5 Pro) обрабатывает 90% запросов. Премиальная (Opus 4.6) принимает оставшиеся 10% — резюме с высокой ставкой, подготовка к board-экзаменам, помеченные преподавателем исследовательские запросы. Эта двухуровневая схема — то, что удерживает месячную стоимость на студента ниже 187 ₽ при защитимом качестве.
Избегайте самохостинга open-weight-моделей (Llama 4, Mistral) для основного пути генерации — если у вас нет конкретного требования по локализации данных или экономии. Накладные расходы на эксплуатацию и GPU съедают маржу на типичных институциональных объёмах (<50 тыс. студентов).
Педагогический движок: как операционализировать науку обучения
Самый частый провал, который мы видим в AI-инструментах для обучения, — генерация контента, который выглядит как учебный материал, но не операционализирует ни одной реальной концепции из науки об обучении. Вот минимальный набор.
- Маппинг по таксономии Блума. Каждый сгенерированный вопрос помечается одним из шести когнитивных уровней (Помнить, Понимать, Применять, Анализировать, Оценивать, Создавать). Мы явно пишем в промпте: "Сгенерируй три MCQ уровня Применять по этому фрагменту" — а не оставляем когнитивную сложность на волю случая.
- Интервальное повторение с FSRS. Free Spaced Repetition Scheduler удерживает материал лучше классического SM-2 (стандарт Anki). Планируйте повторения на 1, 3, 7, 14 и 30 дней; корректируйте интервалы по правильности ответа.
- Активное припоминание по умолчанию. Никогда не показывайте ответ первым; всегда заставляйте студента попытаться вспомнить. Платформа, которая позволяет пассивно перечитывать AI-резюме, приносит больше вреда, чем пользы.
- Интерливинг. Перемешивайте темы внутри сета квизов вместо блочной практики. Интерливинг ощущается сложнее, но даёт перенос знаний на новые задачи на 40–50% лучше.
- Затухание разобранных примеров. Первая попытка — полное решение. Вторая — только первый шаг. Третья — подсказка по стратегии. Четвёртая — без помощи. Предотвращает зависимость.
- Промптинг по методу Фейнмана. После концепции спросите: "Объясните это простыми словами тому, кто не изучал тему". Модель отмечает пробелы в терминологии в объяснении студента — именно там и сидит заблуждение.
- Пороги мастерства. Не продвигайте студента дальше, пока он не наберёт 85% на новых задачах (не на тех же, которые изучал). Иначе вы измеряете не обучение, а узнаваемость.
Обучение по видео: превращаем лекции в учебные материалы
Высшее образование и корпоративный L&D сильно опираются на запись лекций. Платформа уровня 2026 года должна работать с видео как с первоклассным источником.
- Транскрипция. Deepgram Nova-3 — 34 ₽/час в батче, 0,57 ₽/мин в стриминге. AssemblyAI Universal-3 дешевле в базе — 11 ₽/час (плюс доплаты за дополнительные функции). На 10 тыс. часов в месяц AssemblyAI примерно в 3 раза дешевле; Deepgram выигрывает по точности на технической лексике.
- Автоматическое разбиение на главы. Twelve Labs Pegasus 1.2 + эмбеддинги Marengo 3.0 дают определение смены тем и поисковые клипы. 6 ₽/час видео/мес за хранение; дёшево, чтобы прогнать всю лекционную библиотеку семестра.
- Извлечение клипов. Из 90-минутной лекции выдёргиваете 3–6 моментов, на которые ссылаются чаще всего. Они становятся хребтом учебного материала.
- Вендоры записи лекций в высшем образовании. Kaltura, Panopto, Echo360, YuJa — все умеют экспорт в SCORM и xAPI. Если ваш заказчик уже использует один из них, интегрируйтесь, а не заменяйте.
Что это даёт: студент, пропустивший лекцию, получает автогенерированное оглавление, переходные видеоклипы по каждой главе и колоду флешкарт, синхронизированную с лекцией. Для институциональных заказчиков это часто единственная фича, которая делает выбор в пользу вашего продукта против обычного LLM-чатбота. Шире про видеопайплайн мы пишем в руководстве по AI-стриминговым платформам 2026 года.
Голосовой тьюторинг: разговорные агенты с задержкой меньше секунды
Голосовой тьюторинг в 2025 году перешёл из стадии демо в стадию готового продукта. В 2026 году лидируют три вендора.
| Провайдер | Задержка по полному кругу | Сильная сторона |
|---|---|---|
| Deepgram Voice Agent | <300 мс | Самое надёжное предсказание конца мысли; самый низкий процент перебиваний |
| OpenAI gpt-realtime | 150–300 мс | Самая глубокая разговорная динамика; иногда пропускает реплику |
| ElevenLabs Conversational AI | ~75 мс только TTS | Самый быстрый голос, самая широкая голосовая библиотека; больше перебиваний |
Конкретно для тьюторинга мы по умолчанию выбираем Deepgram Voice Agent. Низкий процент перебиваний — это то, что создаёт ощущение разговора с живым тьютором, а не голосовой почты. Если студент замолкает посреди мысли, агент ждёт. Это критично для младше 13 лет.
Подробно про голосовой стек мы писали в руководстве по голосовым мобильным приложениям.
RAG для учебников: битва за чанкинг
Поиск — единственный самый большой рычаг качества. Ошибётесь — и лучшая LLM в мире уверенно выдаст вам ерунду.
Три стратегии чанкинга для образовательного контента.
- Семантический чанкинг. Эмбеддите каждое предложение; группируйте по косинусной близости. Сохраняет границы концепций. Хорош для смешанных тем. Медленнее при индексации.
- Поздний чанкинг (late chunking). Передаёте полный документ в модель с длинным контекстом (2M-токенное окно Gemini 2.5 Pro), эмбеддите на уровне документа и потом извлекаете подмножества. Сохраняет ссылки между главами. Наш выбор по умолчанию для структурированных учебников.
- Иерархический чанкинг. Многоуровневый индекс: резюме глав, резюме разделов, абзацы. Маршрутизируете запрос на нужную гранулярность. Лучший вариант для очень больших учебников (>1000 страниц).
Векторные БД. Pinecone (24 ₽/ГБ/мес за хранение + 618 ₽ за 1M чтений, минимум 3 750 ₽) остаётся нашим managed-выбором по умолчанию. Qdrant (1 ₽/час в hybrid cloud, бесплатно до 1 ГБ) — open-source-фаворит для развёртываний с упором на стоимость. Milvus (Zilliz managed, 11 ₽/CU/час) лучше всех масштабируется на 100M+ векторах с DiskANN.
Реранкеры обязательны. Cohere Rerank 3 (~75 ₽ за 1M токенов) или Voyage AI (~150 ₽ за 1M токенов) поверх top-20 найденных чанков. Этот один шаг примерно вдвое снижает уровень галлюцинаций, которые видит студент, — по нашим измерениям.
Практическое правило чанкинга. Начните с иерархического чанкинга на трёх уровнях гранулярности (резюме главы, раздел, абзац). Раз в неделю прогоняйте оценку поиска: отбирайте 50 студенческих вопросов, вручную размечайте, релевантны ли top-5 найденных чанков. Отслеживайте precision@5 как ключевой продуктовый KPI. Команды, которые пропускают этот шаг, через три месяца обнаруживают, что 40% ответов в их квизах заземлены на нерелевантный контекст — а к этому моменту репутация уже подмочена.
Набор функций: что мы выпускаем в v1
Каждый институциональный запуск, который мы ведём, содержит в первом релизе эти 10 фич:
- Загрузка-в-учёбу. Бросаете PDF, презентацию или запись лекции → за минуту получаете оглавление, ключевые термины, 20 флешкарт, 10 вопросов квиза.
- Автогенерация MCQ с ранжированными дистракторами. Правдоподобные, но неверные варианты ответа собираются из похожего контекста, а не из случайных строк.
- Короткие ответы и cloze-задания. Для дисциплин, где MCQ слишком прост (старшие курсы естественных наук, гуманитарные).
- Концептуальные карты. Визуальный граф знаний из терминов и связей.
- Голосовые вопросы и ответы. Тьютор с задержкой меньше секунды, заземлённый на загруженный студентом материал.
- Планировщик интервального повторения. Подсказки на повторение по FSRS — через пуш или email.
- Дашборд прогресса. Процент мастерства по концепции; время до мастерства; кривая удержания.
- Дашборд контроля для преподавателя. Помечает запросы с высокой частотой, показывает транскрипты чата, позволяет переопределять оценки мастерства.
- Детекция плагиата. GPTZero или Turnitin на сданные эссе; цитирование обязательно, когда студенты вставляют AI-сгенерированный текст.
- Встраивание по LTI 1.3. Работает внутри Canvas, Moodle, Blackboard, Schoology без отдельного входа.
Что мы не выпускаем в v1: геймификацию, лидерборды, социальные учебные группы, AR/VR. Это фичи, которые мы добавляем в v2 по запросу со стороны заказчика. В v1 они только отвлекают.
Нужно выпустить эти 10 фич за квартал?
Наш процесс agent engineering выкатывает базовый набор v1 за 10–14 недель. Позвоните или напишите — мы разложим ваш контент, вендоров и путь интеграции с LMS.
Соответствие требованиям: стена, на которой ломаются проекты
Образование — одна из самых жёстко регулируемых продуктовых категорий. Вот контур 2026 года.
| Режим | Область действия | Практическое требование |
|---|---|---|
| FERPA (США) | Все записи студентов K-12 и высшего образования | Никаких PII во внешние API без статуса school-of-record. DPA с каждым вендором. |
| COPPA (США, младше 13) | Правило пересмотрено в июне 2025; полное соответствие — 22 апреля 2026 | Проверяемое родительское согласие на сбор данных; жёстче по передаче третьим сторонам |
| GDPR + GDPR-K (ЕС) | Жители и школы ЕС | Право на объяснение автоматических решений; согласие родителей младше 16 (варьируется по странам) |
| EU AI Act статья 6 | Относит большинство образовательных AI к "высокому риску" | Оценка соответствия; человеческий надзор; прозрачность. Распознавание эмоций в школах запрещено. |
| New York Education Law 2-d | Школы штата Нью-Йорк | Билль о правах родителей по приватности данных; ежегодные раскрытия от вендоров |
| Illinois SOPPA | K-12 в Иллинойсе | Приватность данных студентов; одобрение округа на любого внешнего обработчика данных |
| CCPA / CPRA (Калифорния) | Жители и студенты Калифорнии | Право на удаление, отказ от продажи; категоризация чувствительных PI |
| BIPA (биометрия Иллинойса) | Голосовые отпечатки, сканы лица | Письменное согласие; не храните биометрию, если можете её избежать |
| ADA / Section 508 / WCAG 2.2 AA | Госведомства США + структуры по Title II; федеральные подрядчики | Субтитры, совместимость с программами чтения с экрана, навигация с клавиатуры, контраст цветов |
| EN 301 549 (ЕС) | Госзакупки ЕС | Согласован с WCAG 2.2 AA; обязателен для государственных школ |
Шорткат по соответствию. Прогоняйте 100% данных студентов через прокси-слой до того, как они уйдут в любой внешний AI API. Что покидает периметр: текст задачи, хэшированный ID студента, обезличенные оценки квиза. Что не уходит никогда: имена студентов, возраст, дата рождения, IP-адреса, идентификаторы устройств, геолокация. Если вы не можете в одном предложении объяснить, что уходит в OpenAI или Anthropic, вы провалите аудит FERPA. Эта одна ошибка ломает больше институциональных сделок, чем любая другая.
Академическая честность: детекция и политика
Институциональные заказчики спрашивают про списывание в первые пять минут. Вот честный ответ.
- GPTZero — заявленная точность 99,3%, ложноположительные срабатывания 0,24%; лучший в классе.
- Turnitin AI detection — заявленные 98%; 2–5% ложноположительных на реальных текстах; идёт в составе LMS.
- Copyleaks — заявленные 99%+; модель оплаты по кредитам.
- Originality.ai — тарифы 745–1 120 ₽/мес; сильны для B2B-команд по контенту.
Наше честное прочтение: ни один AI-детектор недостаточно точен, чтобы только на нём строить обвинение, меняющее оценку. Это один сигнал среди нескольких. Реальная защита — это политика:
- Опубликуйте политику использования AI в программе курса. Что разрешено (брейнсторм, обратная связь), что нет (сданный как свой текст).
- Требуйте цитирование AI (в MLA 9, APA 7, Chicago 17 уже есть форматы цитирования AI).
- Журналы активности. Тайм-стемпы, версии черновиков, история правок.
- Процессная оценка. Очный или прокторируемый устный разбор по сданной письменной работе.
Интеграция с LMS: LTI 1.3, xAPI, SCORM
Образовательные учреждения не внедряют отдельно стоящие приложения — они внедряют инструменты, встроенные в LMS. Планируйте интеграцию с первого дня.
- LTI 1.3. Стандарт по умолчанию. Валидация токенов OAuth 2.0. Одна интеграция работает в Canvas, Moodle, Blackboard Ultra, D2L Brightspace, Schoology, Google Classroom. 2–3 недели разработки.
- xAPI (Tin Can). Записывает активность ученика в Learning Record Store в виде statements. Аналитика богаче, чем нативные отчёты LMS. 1–2 недели разработки, если у вас уже есть LRS (Watershed, Learning Locker).
- SCORM 2004 / cmi5. До сих пор обязателен во многих округах. Тестируйте до запуска — не открывайте на 10-й неделе блокер от закупочной службы.
- QTI. XML-формат обмена оценочными материалами. Экспортируйте сгенерированные квизы обратно в Moodle/Canvas.
- OneRoster. Стандарт синхронизации списков между SIS и LMS. Важно, если ваш заказчик использует Infinite Campus, PowerSchool, Skyward.
Модель стоимости: во что обходится эксплуатация
Конкретные цены 2026 года. Корректируйте под объём контента, число активных студентов и выбранную LLM.
| Компонент | Цена за единицу | Типичная стоимость в месяц |
|---|---|---|
| LLM (Claude Sonnet 4.6, тариф 1) | 225 / 1 125 ₽ за MTok | 112–187 ₽/студент |
| LLM (Opus 4.6, тариф 2, 10% нагрузки) | 375 / 1 875 ₽ за MTok | +37 ₽/студент |
| Голосовой агент (Deepgram) | 0,57 ₽/мин стриминг + TTS | 37–150 ₽/студент (от использования) |
| Векторная БД (Pinecone) | 24 ₽/ГБ/мес + 618 ₽ за 1M чтений | 15 тыс.–150 тыс. ₽ (для учреждения) |
| Реранкер (Cohere Rerank 3) | ~75 ₽ за 1M токенов | 7,5–37 тыс. ₽ |
| Транскрипция (Deepgram batch) | 34 ₽/час | 15–75 тыс. ₽ |
| Понимание видео (Twelve Labs) | 6 ₽/час видео/мес хранение | 7,5–37 тыс. ₽ |
| AI-детекция (Turnitin / GPTZero) | Оплата за работу | 7,5–60 тыс. ₽ |
| Итого на активного студента | — | 225–487 ₽/мес |
Ориентиры цен для покупателя. B2C-подписки идут по 750–1 500 ₽/мес. Институциональный B2B per-seat — 150–600 ₽/студент/мес. Школьная лицензия по фиксированной цене — 375 тыс.–1,1 млн ₽/год на 100–300 студентов. Крупные округа (10 тыс.+ мест) договариваются о 37–225 ₽/студент/мес. Целевая валовая маржа на слое генерации — 60–70%; чистая — 15–25% после операционки, CAC и поддержки.
Мини-кейс: студенческая платформа университета за 12 недель
Среднего размера американский университет пришёл к нам с задачей: 18 тыс. студентов, 400+ курсов, LMS Canvas и библиотека из ~14 тыс. часов видеолекций. Расходы на ассистентов преподавателей раздулись до 240 млн ₽/год, а процент сдачи курсов студентами просел на три пункта за последние два академических года.
Мы выпустили AI-платформу для учёбы за 12 недель на базе эталонного стека выше:
- Загрузка. Ночной батч нового контента из Canvas + записи лекций из Panopto через Deepgram Nova-3; программы курсов и учебники в PDF — через LlamaParse.
- RAG. Иерархический чанкинг по уровням главы / раздела / абзаца; поды Pinecone, разнесённые по курсам так, что протечка между курсами становится невозможной; Cohere Rerank 3 поверх top-20.
- Генерация. Claude Sonnet 4.6 на флешкарты и MCQ; Opus 4.6 на обратную связь по эссе и вопросы стиля board-экзаменов.
- Голосовой тьютор. Deepgram Voice Agent для чата в режиме office hours, заземлённый строго на контент курсов студента.
- Дашборд преподавателя. В реальном времени видны мастерство по студентам, транскрипты AI-чата, помеченные высокочастотные пользователи.
- Встраивание по LTI 1.3 в Canvas.
Результаты за 90 дней. Еженедельная активность студентов вышла на 62% от записанных. Процент сдачи курсов отыграл 2,1 пункта из потерянных 3. Часы ассистентов преподавателей просели на 28% в пилотных курсах. Итоговая стоимость AI-эксплуатации: 307 ₽ на активного студента в месяц. CIO учреждения подписал двухлетний контракт ещё до окончания пилота.
5 ловушек, которые губят AI-проекты для учебных материалов
- 1. Галлюцинации в математике и истории. Фронтирные модели по-прежнему дают 10–20% галлюцинаций на задачах фактического воспроизведения. Без заземления через RAG, ранжированных дистракторов и контура проверки преподавателем каждый ваш квиз содержит спрятанные неверные ответы. Закладывайте 10–15% от регулярной стоимости на человеческий QA-слой.
- 2. Сверхзависимость убивает метакогницию. Студенты пропускают стадию борьбы; пассивное потребление вытесняет активное припоминание. Продукт выглядит успешным по метрикам вовлечённости, но проваливается по реальному обучению. Контрмера: затухание разобранных примеров, обязательное припоминание до показа ответа, лимиты активности.
- 3. Нарушение FERPA через API. Отправка имён, дат рождения или оценок в OpenAI или Anthropic как открытый текст — это утечка данных. В каждом проекте, который мы видели, был хотя бы один инженер, который это попробовал. Контрмера: жёсткий прокси-слой со списком разрешённых полей, которые могут покидать периметр.
- 4. Плохой поиск, прячущийся за хорошей LLM. LLM уверенно выдаёт правдоподобную ерунду, когда найденные чанки нерелевантны. Контрмера: реранкеры, иерархический чанкинг, регулярный человеческий аудит top-10 найденных чанков по учебнику.
- 5. Отсутствие контура контроля для преподавателя. Студенты обходят правила, запрашивают ответы напрямую, используют платформу для плагиата. Преподаватели ничего не видят. Контрмера: обязательный дашборд преподавателя, журналы активности, проверка транскриптов чата, интеграция с системой детекции плагиата. Институциональные заказчики не продлят контракт без этого.
Паттерн 60-дневного пилота. Никогда не запускайтесь на весь округ сразу. Запуститесь в одном курсе с преподавателем, который активно хочет участвовать в проектировании; проведите 60-дневный пилот с еженедельными петлями обратной связи; точно измерьте один-два KPI (прирост мастерства, время на задаче); потом масштабируйтесь. Все быстро вышедшие в массовое внедрение EdTech-сделки последних трёх лет шли по этому паттерну. Все медленные и провалившиеся пытались сразу пойти вширь.
KPI: что измерять
Выбирайте минимальный набор, который вы готовы защищать. Список короткий специально.
- Прирост мастерства. Правильность до и после учебной сессии на новых задачах (не из обучающего сета). Цель: +20 процентных пунктов от базовой линии за часовую сессию.
- Удержание. Правильность на интервалах в 1 неделю и 30 дней. Интервальное повторение должно давать удержание в 2–3 раза лучше, чем зубрёжка.
- Время до мастерства. Минут на концепцию до достижения 85% правильности на новых задачах. Следите за регрессиями по мере роста библиотеки контента.
- Уровень галлюцинаций. Процент AI-сгенерированных фактических утверждений, которые оказались неверны, по результатам QA преподавателя. Цель: <2%. Исследования тьюторинга Стэнфордского периода показывают, что 0,1% достижим с агрессивным "человеком в цикле".
- Еженедельная активность пользователей (для учреждения). Цель — 60%+ от записанных учеников. Ниже 40% — продукт недостаточно липкий.
- Удовлетворённость преподавателей (NPS). Продление институциональных контрактов держится на преподавателях, а не на студентах. Цель — NPS > 40 за 90 дней.
Когда AI-платформу для обучения строить НЕ стоит
Каждый квартал мы отказываемся от проектов AI-платформ для обучения. Сигналы, что это не ваш случай:
- Ваш ключевой контент — это сертификация с высокой ставкой (медицинская лицензия, экзамен на адвоката), где 2% галлюцинаций недопустимы, а бюджета на экспертный QA, чтобы опустить уровень ниже 0,1%, у вас нет.
- Ваш целевой покупатель — округ с устаревшей LMS (Blackboard Learn 9.1 или подобное), которая не поддерживает LTI 1.3. Стоимость интеграции съедает проект.
- Вы не можете подписать DPA с провайдером LLM в своей юрисдикции. Требования к локализации данных в образовании в ЕС и Канаде отрезают неожиданно много комбинаций вендоров.
- Ваш контент в основном рукописный (старые учебники, архивные материалы), а бюджет на OCR — ноль. Ошибки OCR накапливаются на каждом следующем слое.
- Вы продаёте аудитории без преподавателя в цикле (чистый B2C для самообучения) и у вас нет инфраструктуры QA, чтобы отлавливать галлюцинации постфактум. В чистом B2C проблема галлюцинаций фактически нерешаема по той цене, которую готов платить студент.
Фреймворк выбора: подберите стек за шесть вопросов
- Кто покупатель? B2C-студенты → freemium + подписка, опора на вовлечённость. Учреждения → LTI 1.3, дашборд преподавателя, DPA.
- Какой основной контент? Учебники → длинный контекст Gemini 2.5 Pro или иерархический чанкинг + Sonnet 4.6. Лекции → Deepgram + Twelve Labs + Sonnet 4.6. Смешанный → и то, и другое.
- Какой уровень ставок? Домашка K-12 → Sonnet 4.6, дёшево. Board-экзамены → Opus 4.6, агрессивный QA, экспертный разбор каждого вопроса.
- Какие юрисдикции? Только США → FERPA + COPPA + законы штатов. ЕС → GDPR + AI Act статья 6. И то, и другое → начинайте с более строгого режима и спускайтесь ниже.
- Какие требования к голосу? Опционально → откладывайте в v2. Ядро продукта → Deepgram Voice Agent, бюджет 37–150 ₽/студент/мес.
- Сколько нужно контроля от преподавателя? Мало (самообучение) → опора на AI-детекцию + журналы активности. Много (учреждение) → полный дашборд преподавателя, разбор транскриптов, контроли с правом перекрыть.
Хотите, чтобы мы прошли этот фреймворк вместе с вами?
Пришлите состав контента, целевой рынок и ограничения по соответствию. Мы вернёмся с рекомендацией по стеку и планом на 14 недель.
Дорожная карта интеграции: путь в 10–14 недель
| Недели | Фаза | Результат |
|---|---|---|
| 1–3 | Discovery + аудит контента | Рекомендация по фреймворку, матрица вендоров, карта данных FERPA/GDPR, объём интеграции с LMS |
| 3–5 | Настройка RAG | Индекс Pinecone / Qdrant, иерархический чанкинг, интеграция реранкера, оценочная обвязка |
| 5–9 | Базовые AI-функции | Флешкарты, квизы, резюме, концептуальные карты, видео-в-конспект на тестовом контенте |
| 9–11 | Чат + голосовой тьютор | Deepgram Voice Agent, чат с заземлением на контекст, дашборд преподавателя v1 |
| 11–12 | LTI 1.3 + xAPI | Встраивание в Canvas / Moodle, SSO, логирование активности, интеграция с LRS |
| 12–13 | Соответствие + доступность | Аудит FERPA, проверки WCAG 2.2 AA, прокси-слой данных, подписанные DPA |
| 13–14 | Пилот + закаливание для продакшена | Раскатка 60-дневного пилота, наблюдаемость, ранбук дежурного, SLA |
Каждый проект Фора Софт начинается не с выбора инструментов, а с discovery первой недели. Выберите не ту LLM или векторную БД — и через полгода будете переписывать слой данных. Выберите правильно — и интеграция уложится в десять недель.
Куда движутся AI-инструменты для обучения в 2026–2027
Мульти-агентный тьюторинг. Один агент генерирует вопросы, второй критикует ответ, третий играет роль однокурсника. Ранние эксперименты в Khan Academy и Стэнфорде показывают прирост удержания на 20%+ по сравнению с одно-агентным тьюторингом.
Локальные модели для сценариев "младше 13". Apple Foundation Models и Gemini Nano на Android закрывают петлю COPPA, удерживая данные студентов на устройстве. Ждите волны инструментов для младшей школы с local-first-архитектурой в 2027 году.
Сертификация по EU AI Act как "высокого риска". К июню 2026 правила статьи 50 вступают в силу; к августу 2026 включаются полные обязательства по высокому риску (статья 6). Образовательные AI-вендоры в ЕС без проведённой оценки соответствия будут отрезаны от госзакупок.
Голос-первый тьюторинг становится нормой. Задержка ниже 300 мс делает голос естественным; телефоны вытесняют ноутбуки как основное учебное устройство для поколения Z. Ждите, что путь "голос-в-учебный-материал" станет ключевым флоу к 2027 году.
Больший ROI приносит AI для преподавателя, а не для студента. Генерация планов уроков, оценка формирующего тестирования, дифференциация. Самый тихий и самый устойчивый сегмент.
FAQ
Может ли AI-генератор учебных материалов заменить тьютора?
Для практики с низкой ставкой — да, особенно в масштабе, где человеческий тьюторинг экономически невозможен. Для коучинга с высокой ставкой, диагностики устойчивых заблуждений и мотивации — нет. Планируйте гибрид "AI + человек", а не чистую замену.
Какая LLM лучше всего подходит для генерации учебных материалов?
Claude Sonnet 4.6 — наш выбор по умолчанию: 225/1 125 ₽ за MTok и контекст 1M. Gemini 2.5 Pro — самый дешёвый при контексте 2M, если вы заземляете на целые учебники. Opus 4.6 — для генерации с высокой ставкой (board-экзамены, исследовательские задачи). Используйте двухуровневую маршрутизацию, чтобы расходы оставались предсказуемыми.
Как держать AI-инструменты для обучения в соответствии с FERPA?
Прогоняйте все данные студентов через прокси-слой. Периметр покидают только текст задачи, хэшированные ID студентов и обезличенные оценки. Никаких имён, дат рождения, IP-адресов и геолокации. Подписывайте DPA с каждым внешним API, включая OpenAI и Anthropic. Документируйте поток данных от начала до конца — регуляторы спрашивают.
Какая стоимость на студента?
При типичной институциональной нагрузке (50–100 генераций квизов, 200–500 сообщений в чате, 20–30 наборов флешкарт в месяц) AI-эксплуатация стоит 225–487 ₽ на активного студента в месяц. Берёте с заказчика 150–600 ₽/студент/мес в B2B или 750–1 500 ₽/мес в B2C. Целевая валовая маржа на слое генерации — 60–70%.
Насколько точны AI-детекторы?
GPTZero заявляет 99,3% при 0,24% ложноположительных; Turnitin — 98% при 2–5% ложноположительных на реальных текстах. Ни один детектор не точен настолько, чтобы строить на нём обвинение, меняющее оценку. Используйте их как один сигнал; сочетайте с процессной оценкой и журналами активности.
Нужно ли менять нашу LMS?
Нет. Современные AI-инструменты для обучения встраиваются через LTI 1.3 в Canvas, Moodle, Blackboard Ultra, D2L Brightspace, Schoology и Google Classroom без замены LMS. В типичном проекте на это уходит 2–3 недели разработки.
Какой уровень галлюцинаций допустим?
Ниже 2% фактических ошибок для практики с низкой ставкой; ниже 0,1% для подготовки к board-экзаменам с высокой ставкой. Последнее требует агрессивного "человека в цикле". Закладывайте 10–15% от регулярной стоимости на проверку преподавателями.
Можно ли выпустить платформу обучения меньше чем за 10 недель?
Для B2C MVP по узкой теме (например, "помощник по AP Biology") — да, 6–8 недель достижимы с нашим процессом agent engineering. Для институционального продукта со встраиванием по LTI, полным соответствием и дашбордом преподавателя реалистичный минимум — 10–14 недель.
Что почитать дальше
Тьюторинг
Интеллектуальные системы тьюторинга для педагогов
Как педагогика ITS ложится на архитектуры LLM 2026 года.
Видеоинфраструктура
AI-стриминговые платформы: руководство 2026
Видеослой под каждым e-learning-продуктом.
Языки
AI для синхронного перевода
Многоязычные классы и живой перевод.
Голос
Голосовые мобильные приложения
Подробно про стек голосового тьютора.
Подытожим
Генерация учебных материалов с помощью AI в 2026 году уже не новизна. Категория растёт на 31% в год; адаптивное обучение само по себе достигнет 911 млрд ₽ к 2035 году. Победившая форма — единая платформа, объединяющая генерацию флешкарт, разговорный тьюторинг, понимание контента и встраивание в LMS — построенная на пятислойном стеке: загрузка, RAG, генерация, педагогика, доставка + контроль.
Сложная часть — не LLM. Это качество поиска, которое решает, будет ли ваш тьютор галлюцинировать; дисциплина соответствия, которая решает, пройдёте ли вы аудит FERPA; и контур контроля от преподавателя, который решает, продлят ли учреждения контракт. Сделайте эти три правильно — и инженерия выпадет в осадок за 10–14 недель с современным инструментарием. Сделайте неправильно — и выпустите демо, которое выглядит умно и никого ничему не учит.
Готовы спроектировать вашу AI-платформу для обучения?
20 лет в видео + 8 лет в AI + опыт поставки в образовании. Пришлите контент, целевого покупателя и ограничения по соответствию — мы вернёмся с рекомендацией по архитектуре.

