Utvärdering via ramverk

En poäng räknas bara om den är förankrad
i kompetensramverket.

Varje roleplay-mall deklarerar vilka kompetenser varje scenario testar. AI:n poängsätter exakt dessa kriterier, inga nyckelords-heuristiker, ingen plattformsövergripande katalog tvingad på dig.

Boka demo Tillbaka till översikten

Sessionsrapport

Läkarbesök, skeptisk kardiolog

Trainee: Marcela R. · Kanal: röst · 12 min

godkänd

Kompetenser frysta vid utskick

PROD-001

Produktbehärskning

OBJ-003

Invändningshantering

COMP-014

Etikettcompliance

Utvärderade kriterier (rubrik)

Argument förankrade i klinisk evidens 92

Förståelse av HCP-rutinen 85

Återhämtning efter en stark invändning 78

Avslut med tydligt nästa steg 88

Etikettcompliance RDC 658 (compliance blocker) 95

AI-insikter · styrkor

Förankrade pitchen i HCPs profil av hypertensiv patient vid 1:15. Citerade en fas 3-studie när hen ifrågasattes om effekt.

Områden att förbättra

Vid 4:32 frågade HCPen om interaktion med betablockerare och svaret var vagt ("Jag kollar och återkommer"). Rekommendation: riktad utbildning om läkemedelsinteraktioner.

Din kunder ramverk

Varje kund har sin egen katalog av kompetenser och kriterier. Klonad från de centrala katalogerna per vertikal vid onboarding, sedan fullt redigerbar, du lägger till kompetenser specifika för din verksamhet som inte finns i någon katalog.

AI:n poängsätter. Kod beslutar.

AI:n äger poängsättningen. Godkänd/underkänd-regeln är granskningsbar kod, inklusive "compliance blockers" som underkänner sessionen även med hög poäng (t.ex. att bryta mot etiketten, underkänd, även med 95 totalt).

Fryst för revision

Kriterier frysta vid utskick. Prompt låst till en specifik version. Transkript, ljud och rapport sparas med konfigurerbar retention. Revisionen kommer redo direkt.

Från ramverk till rapport.

Hela kedjan är deterministisk och granskningsbar.

Kurering av ramverk

Kund-administratör redigerar kompetenser, kriterier och scenariokontexter. Lägg till, redigera, inaktivera, allt är versionerat.

Mallen deklarerar

I guiden väljer författaren vilka kompetenser varje scenario i mallen testar. Vikten för varje kriterium är konfigurerbar.

Roleplayen fryser

Vid utskick tas en snapshot av kriterierna på roleplayen. Även om mallen redigeras senare körs sessionen mot snapshotten.

AI poängsätter, kod beslutar

Asynkront jobb: bygger prompten med transkript, frågar AI:n efter strukturerad JSON, parsar det, tillämpar godkänd/underkänd-regler, persisterar full aggregat.

Varför en modell per yta

En specialiserad modell, vassare kriterier.

Vi mätte multi-modell-konsensus: kör flera modeller parallellt och ta medelvärdet. Den lilla precisionsvinsten motiverade inte den extra kostnaden och latensen, så vi valde bort det.

Istället: en kurerad modell per yta (chatt, röst), med en versionerad prompt validerad mot rubriken. Vi investerar i vassare kriterier och snabbare återkoppling. Deterministiskt, debugbart, jämförbart mellan sessioner.

Multi-modell-konsensus (bortvalt)