Utvärdering via ramverk

En poäng räknas bara om den är förankrad
i kompetensramverket.

Varje roleplay-mall deklarerar vilka kompetenser varje scenario testar. AI:n poängsätter exakt dessa kriterier, inga nyckelords-heuristiker, ingen plattformsövergripande katalog tvingad på dig.

Sessionsrapport

Läkarbesök, skeptisk kardiolog

Trainee: Marcela R. · Kanal: röst · 12 min

87

godkänd

Kompetenser frysta vid utskick

PROD-001

Produktbehärskning

92

OBJ-003

Invändningshantering

78

COMP-014

Etikettcompliance

95

Utvärderade kriterier (rubrik)

Argument förankrade i klinisk evidens 92
Förståelse av HCP-rutinen 85
Återhämtning efter en stark invändning 78
Avslut med tydligt nästa steg 88
Etikettcompliance RDC 658 (compliance blocker) 95

AI-insikter · styrkor

Förankrade pitchen i HCPs profil av hypertensiv patient vid 1:15. Citerade en fas 3-studie när hen ifrågasattes om effekt.

Områden att förbättra

Vid 4:32 frågade HCPen om interaktion med betablockerare och svaret var vagt ("Jag kollar och återkommer"). Rekommendation: riktad utbildning om läkemedelsinteraktioner.

Din kunder ramverk

Varje kund har sin egen katalog av kompetenser och kriterier. Klonad från de centrala katalogerna per vertikal vid onboarding, sedan fullt redigerbar, du lägger till kompetenser specifika för din verksamhet som inte finns i någon katalog.

AI:n poängsätter. Kod beslutar.

AI:n äger poängsättningen. Godkänd/underkänd-regeln är granskningsbar kod, inklusive "compliance blockers" som underkänner sessionen även med hög poäng (t.ex. att bryta mot etiketten, underkänd, även med 95 totalt).

Fryst för revision

Kriterier frysta vid utskick. Prompt låst till en specifik version. Transkript, ljud och rapport sparas med konfigurerbar retention. Revisionen kommer redo direkt.

Från ramverk till rapport.

Hela kedjan är deterministisk och granskningsbar.

01

Kurering av ramverk

Kund-administratör redigerar kompetenser, kriterier och scenariokontexter. Lägg till, redigera, inaktivera, allt är versionerat.

02

Mallen deklarerar

I guiden väljer författaren vilka kompetenser varje scenario i mallen testar. Vikten för varje kriterium är konfigurerbar.

03

Roleplayen fryser

Vid utskick tas en snapshot av kriterierna på roleplayen. Även om mallen redigeras senare körs sessionen mot snapshotten.

04

AI poängsätter, kod beslutar

Asynkront jobb: bygger prompten med transkript, frågar AI:n efter strukturerad JSON, parsar det, tillämpar godkänd/underkänd-regler, persisterar full aggregat.

Varför en modell per yta

En specialiserad modell, vassare kriterier.

Vi mätte multi-modell-konsensus: kör flera modeller parallellt och ta medelvärdet. Den lilla precisionsvinsten motiverade inte den extra kostnaden och latensen, så vi valde bort det.

Istället: en kurerad modell per yta (chatt, röst), med en versionerad prompt validerad mot rubriken. Vi investerar i vassare kriterier och snabbare återkoppling. Deterministiskt, debugbart, jämförbart mellan sessioner.

Multi-modell-konsensus (bortvalt)

  • ✗ Flera gånger kostnaden utan motsvarande konfidens
  • ✗ Högre latens i återkopplingen
  • ✗ Svårt att debugga en enskild poäng
  • ✗ Inkonsekvent diff mellan sessioner

En leverantör per ytan

  • ✓ Kostnad kontrollerad per anrop
  • ✓ Versionerad och granskningsbar prompt
  • ✓ Reproducerbart resultat
  • ✓ Konsekvent jämförelse mellan sessioner

Redo att förändra hur ert team utbildas?

För företag från 50 medarbetare. Boka 45 minuter och vi tänker setup tillsammans med er.