Оценка по модели
Балл что-то значит только тогда,
когда привязан к модели компетенций.
Каждый шаблон роуплея объявляет, какие компетенции тестирует каждый сценарий. ИИ оценивает ровно эти критерии, без эвристик по ключевым словам, без навязанного общего каталога.
Отчёт по сессии
Медицинский визит, скептически настроенный кардиолог
Стажёр: Марсела Р. · Канал: голос · 12 мин
87
пройдено
Компетенции, зафиксированные при назначении
PROD-001
Владение продуктом
92
OBJ-003
Работа с возражениями
78
COMP-014
Соответствие инструкции
95
Оцениваемые критерии (рубрика)
Инсайты ИИ · Сильные стороны
Привязала питч к профилю гипертонических пациентов врача к 1:15. Сослалась на исследование фазы III, когда её оспорили по эффективности.
Зоны роста
На 4:32 врач спросил про взаимодействие с бета-блокаторами, ответ был размытым («уточню и вернусь»). Рекомендация: точечная отработка по лекарственным взаимодействиям.
Модель вашего клиента
У каждого клиента собственный каталог компетенций и критериев. Клонируется из центральных каталогов по вертикали при онбординге, затем полностью редактируется, вы добавляете компетенции, специфичные для вашего бизнеса, которых нет ни в одном каталоге.
ИИ ставит баллы. Код принимает решение.
ИИ отвечает за проставление баллов. Правило pass/fail это проверяемый код, включая «блокеры комплаенса», которые проваливают сессию даже при высоком балле (например, нарушение инструкции → провал, даже при 95 общих).
Зафиксировано для аудита
Критерии зафиксированы при назначении. Промпт закреплён на конкретной версии. Транскрипт + аудио + отчёт сохраняются с настраиваемым хранением. Аудит готов «из коробки».
От модели до отчёта.
Вся цепочка детерминирована и проверяема.
01
Курирование модели
Админ клиента редактирует компетенции, критерии и контексты сценариев. Добавление, изменение, деактивация, всё версионируется.
02
Шаблон объявляет
В мастере автор выбирает, какие компетенции тестирует каждый сценарий шаблона. Вес каждого критерия настраивается.
03
Роуплей фиксирует
При назначении критерии сохраняются снимком на роуплее. Даже если шаблон редактируется позже, сессия проводится против снимка.
04
ИИ ставит баллы, код принимает решение
Асинхронный job: собирает промпт + транскрипт, запрашивает у ИИ структурированный JSON, парсит его, применяет правила pass/fail, сохраняет полный агрегат.
Почему не консенсус нескольких ИИ
Несколько ИИ не складываются, а расходятся.
Мы пробовали: запустить 4 модели параллельно и взять среднее. Проблема в том, что у каждой модели разное систематическое смещение, и среднее размывает сигнал от той модели, что попала точно.
Вместо этого: одна выбранная модель на каждую поверхность, с версионированным промптом, выверенным по рубрике. Детерминированно, отлаживается, сравнивается по сессиям.
Консенсус из нескольких ИИ
- ✗ В 4 раза дороже без 4-кратной уверенности
- ✗ Размывает разнонаправленное смещение
- ✗ Сложно отладить итоговый балл
- ✗ Несогласованные разницы между сессиями
Один провайдер на поверхность
- ✓ Стоимость под контролем на каждом вызове
- ✓ Версионированный и проверяемый промпт
- ✓ Воспроизводимый результат
- ✓ Согласованное сравнение между сессиями
Отлично сочетается с
Адаптивный трек
Пробел в модели → автоматический роуплей
Модель на этой странице это вход, который адаптивный трек использует для разметки пробелов в компетенциях.
Узнать больше →Дашборды
Прогресс по компетенциям
Следите, как каждый член команды растёт (или проседает) по каждому критерию модели во времени.
Узнать больше →Комплаенс
Журнал аудита для каждого вызова
Промпт, модель, токены, стоимость, задержка, всё логируется для регуляторного аудита.
Узнать больше →Готовы изменить подход к обучению вашей команды?
Бесплатная пробная версия для команд до 20 человек. Корпоративный? Давайте поговорим.