Оцінка за фреймворком
Оцінка має сенс, лише коли вона прив’язана
до моделі компетенцій.
Кожен шаблон roleplay декларує, які компетенції тестує кожен сценарій. ШІ оцінює саме ці критерії, без евристик за ключовими словами, без накинутого вам платформного каталогу.
Звіт сесії
Медичний візит, скептичний кардіолог
Учень: Марсела Р. · Канал: Голос · 12 хв
87
пройдено
Компетенції, зафіксовані на момент призначення
PROD-001
Володіння продуктом
92
OBJ-003
Робота з запереченнями
78
COMP-014
Комплаєнс з інструкцією
95
Оцінені критерії (rubric)
AI-інсайти · Сильні сторони
Привʼязала пітч до профілю гіпертонічного пацієнта HCP на 1:15. Процитувала дослідження фази 3, коли поставили виклик щодо ефективності.
Сфери для покращення
На 4:32 HCP запитав про взаємодію з бета-блокаторами, і відповідь була розмитою ("Я перевірю і відповім"). Рекомендація: цільове навчання з лікарських взаємодій.
Фреймворк вашого клієнта
Кожен клієнт має власний каталог компетенцій та критеріїв. Клонується з центральних каталогів за вертикаллю при онбордингу, потім повністю редагований, ви додаєте компетенції, специфічні для вашого бізнесу, яких немає в жодному каталозі.
ШІ оцінює. Код вирішує.
ШІ володіє оцінкою. Правило pass/fail це аудитований код, включно з "блокерами комплаєнсу", що провалюють сесію навіть з високим балом (напр., порушення інструкції → провал, навіть з 95 загальним).
Зафіксовано для аудиту
Критерії зафіксовані на момент призначення. Prompt прикріплено до конкретної версії. Транскрипт + аудіо + звіт зберігаються з конфігурованим терміном збереження. Аудит з коробки.
Від фреймворку до звіту.
Уся ланцюгова детермінована та аудитована.
01
Курування фреймворку
Tenant admin редагує компетенції, критерії та контексти сценаріїв. Додавання, редагування, деактивація, усе версіоновано.
02
Шаблон декларує
У майстрі автор вибирає, які компетенції тестує кожен сценарій шаблону. Вага кожного критерію конфігурована.
03
Roleplay фіксує
На момент призначення критерії знімаються у snapshot на roleplay. Навіть якщо шаблон редагується пізніше, сесія проходить проти snapshot.
04
ШІ оцінює, код вирішує
Async job: будує prompt + транскрипт, запитує у ШІ структурований JSON, парсить, застосовує правила pass/fail, зберігає повний агрегат.
Оцінювання за фреймворком
Оцінювання починається з компетенцій Вашої компанії.
Кожна компанія визначає власний фреймворк компетенцій: здібності, критерії, ваги. Кожна оцінка завжди порівнюється з цим фреймворком, а не з універсальною рубрикою.
Кожен сценарій оголошує, які компетенції він тестує, з версіонованим prompt, перевіреним проти rubric. Відтворювано, дебажиться, порівнюється між сесіями.
Стандартні універсальні критерії
- ✗ Не відображають мову Вашої компанії
- ✗ Однакове оцінювання для всіх галузей
- ✗ Неможливо змінити ваги або додати критерії
- ✗ Аудитори не знають, як ставилася оцінка
Фреймворк компетенцій Вашої компанії
- ✓ Використовує Ваші здібності та лексику
- ✓ Налаштовувані ваги за галуззю та роллю
- ✓ Версіонований та аудитований prompt
- ✓ Послідовне порівняння між сесіями
Чудово поєднується з
Адаптивна траєкторія
Прогалина фреймворку → автоматичний roleplay
Фреймворк на цій сторінці це вхід, який адаптивна траєкторія використовує для мапінгу прогалин компетенцій.
Дізнатися більше →Дашборди
Прогрес на компетенцію
Спостерігайте, як кожен член команди зростає (або падає) у кожному критерії фреймворку з часом.
Дізнатися більше →Комплаєнс
Журнал аудиту для кожного виклику
Prompt, модель, токени, вартість, латентність, усе логується для регуляторного аудиту.
Дізнатися більше →Готові змінити підхід до навчання вашої команди?
Безкоштовна пробна версія для команд до 20 осіб. Корпоративний? Давайте поговоримо.