Utvärdering via ramverk
En poäng räknas bara om den är förankrad
i kompetensramverket.
Varje roleplay-mall deklarerar vilka kompetenser varje scenario testar. AI:n poängsätter exakt dessa kriterier, inga nyckelords-heuristiker, ingen plattformsövergripande katalog tvingad på dig.
Sessionsrapport
Läkarbesök, skeptisk kardiolog
Trainee: Marcela R. · Kanal: röst · 12 min
87
godkänd
Kompetenser frysta vid utskick
PROD-001
Produktbehärskning
92
OBJ-003
Invändningshantering
78
COMP-014
Etikettcompliance
95
Utvärderade kriterier (rubrik)
AI-insikter · styrkor
Förankrade pitchen i HCPs profil av hypertensiv patient vid 1:15. Citerade en fas 3-studie när hen ifrågasattes om effekt.
Områden att förbättra
Vid 4:32 frågade HCPen om interaktion med betablockerare och svaret var vagt ("Jag kollar och återkommer"). Rekommendation: riktad utbildning om läkemedelsinteraktioner.
Din kunder ramverk
Varje kund har sin egen katalog av kompetenser och kriterier. Klonad från de centrala katalogerna per vertikal vid onboarding, sedan fullt redigerbar, du lägger till kompetenser specifika för din verksamhet som inte finns i någon katalog.
AI:n poängsätter. Kod beslutar.
AI:n äger poängsättningen. Godkänd/underkänd-regeln är granskningsbar kod, inklusive "compliance blockers" som underkänner sessionen även med hög poäng (t.ex. att bryta mot etiketten, underkänd, även med 95 totalt).
Fryst för revision
Kriterier frysta vid utskick. Prompt låst till en specifik version. Transkript, ljud och rapport sparas med konfigurerbar retention. Revisionen kommer redo direkt.
Från ramverk till rapport.
Hela kedjan är deterministisk och granskningsbar.
01
Kurering av ramverk
Kund-administratör redigerar kompetenser, kriterier och scenariokontexter. Lägg till, redigera, inaktivera, allt är versionerat.
02
Mallen deklarerar
I guiden väljer författaren vilka kompetenser varje scenario i mallen testar. Vikten för varje kriterium är konfigurerbar.
03
Roleplayen fryser
Vid utskick tas en snapshot av kriterierna på roleplayen. Även om mallen redigeras senare körs sessionen mot snapshotten.
04
AI poängsätter, kod beslutar
Asynkront jobb: bygger prompten med transkript, frågar AI:n efter strukturerad JSON, parsar det, tillämpar godkänd/underkänd-regler, persisterar full aggregat.
Varför en modell per yta
En specialiserad modell, vassare kriterier.
Vi mätte multi-modell-konsensus: kör flera modeller parallellt och ta medelvärdet. Den lilla precisionsvinsten motiverade inte den extra kostnaden och latensen, så vi valde bort det.
Istället: en kurerad modell per yta (chatt, röst), med en versionerad prompt validerad mot rubriken. Vi investerar i vassare kriterier och snabbare återkoppling. Deterministiskt, debugbart, jämförbart mellan sessioner.
Multi-modell-konsensus (bortvalt)
- ✗ Flera gånger kostnaden utan motsvarande konfidens
- ✗ Högre latens i återkopplingen
- ✗ Svårt att debugga en enskild poäng
- ✗ Inkonsekvent diff mellan sessioner
En leverantör per ytan
- ✓ Kostnad kontrollerad per anrop
- ✓ Versionerad och granskningsbar prompt
- ✓ Reproducerbart resultat
- ✓ Konsekvent jämförelse mellan sessioner
Passar perfekt ihop med
Adaptive Track
Ramverksgap, automatisk roleplay
Ramverket på den här sidan är inputen som Adaptive Track använder för att mappa kompetensgap.
Läs mer →Dashboards
Framsteg per kompetens
Följ varje teammedlem som stiger (eller faller) på varje ramverkskriterium över tid.
Läs mer →Compliance
Revisionslogg för varje anrop
Prompt, modell, tokens, kostnad, latens, allt loggat för regulatorisk revision.
Läs mer →Redo att förändra hur ert team utbildas?
För företag från 50 medarbetare. Boka 45 minuter och vi tänker setup tillsammans med er.