Оцінка за фреймворком

Оцінка має сенс, лише коли вона прив’язана
до моделі компетенцій.

Кожен шаблон roleplay декларує, які компетенції тестує кожен сценарій. ШІ оцінює саме ці критерії, без евристик за ключовими словами, без накинутого вам платформного каталогу.

Запросити демо Повернутися до огляду

Звіт сесії

Медичний візит, скептичний кардіолог

Учень: Марсела Р. · Канал: Голос · 12 хв

пройдено

Компетенції, зафіксовані на момент призначення

PROD-001

Володіння продуктом

OBJ-003

Робота з запереченнями

COMP-014

Комплаєнс з інструкцією

Оцінені критерії (rubric)

Аргументи на основі клінічних доказів 92

Розуміння рутини HCP 85

Відновлення після сильного заперечення 78

Закриття з чітким наступним кроком 88

Комплаєнс з інструкцією RDC 658 (блокер комплаєнсу) 95

AI-інсайти · Сильні сторони

Привʼязала пітч до профілю гіпертонічного пацієнта HCP на 1:15. Процитувала дослідження фази 3, коли поставили виклик щодо ефективності.

Сфери для покращення

На 4:32 HCP запитав про взаємодію з бета-блокаторами, і відповідь була розмитою ("Я перевірю і відповім"). Рекомендація: цільове навчання з лікарських взаємодій.

Фреймворк вашого клієнта

Кожен клієнт має власний каталог компетенцій та критеріїв. Клонується з центральних каталогів за вертикаллю при онбордингу, потім повністю редагований, ви додаєте компетенції, специфічні для вашого бізнесу, яких немає в жодному каталозі.

ШІ оцінює. Код вирішує.

ШІ володіє оцінкою. Правило pass/fail це аудитований код, включно з "блокерами комплаєнсу", що провалюють сесію навіть з високим балом (напр., порушення інструкції → провал, навіть з 95 загальним).

Зафіксовано для аудиту

Критерії зафіксовані на момент призначення. Prompt прикріплено до конкретної версії. Транскрипт + аудіо + звіт зберігаються з конфігурованим терміном збереження. Аудит з коробки.

Від фреймворку до звіту.

Уся ланцюгова детермінована та аудитована.

Курування фреймворку

Tenant admin редагує компетенції, критерії та контексти сценаріїв. Додавання, редагування, деактивація, усе версіоновано.

Шаблон декларує

У майстрі автор вибирає, які компетенції тестує кожен сценарій шаблону. Вага кожного критерію конфігурована.

Roleplay фіксує

На момент призначення критерії знімаються у snapshot на roleplay. Навіть якщо шаблон редагується пізніше, сесія проходить проти snapshot.

ШІ оцінює, код вирішує

Async job: будує prompt + транскрипт, запитує у ШІ структурований JSON, парсить, застосовує правила pass/fail, зберігає повний агрегат.

Оцінювання за фреймворком

Оцінювання починається з компетенцій Вашої компанії.

Кожна компанія визначає власний фреймворк компетенцій: здібності, критерії, ваги. Кожна оцінка завжди порівнюється з цим фреймворком, а не з універсальною рубрикою.

Кожен сценарій оголошує, які компетенції він тестує, з версіонованим prompt, перевіреним проти rubric. Відтворювано, дебажиться, порівнюється між сесіями.

Стандартні універсальні критерії