Valutazione tramite framework

Un punteggio conta solo se è ancorato
al framework delle competenze.

Ogni template di roleplay dichiara quali competenze testa ciascuno scenario. L'IA valuta esattamente quei criteri, senza euristiche su parole chiave, senza un catalogo generico imposto dalla piattaforma.

Report di sessione

Visita medica, cardiologo scettico

Collaboratore: Marcela R. · Canale: Voice · 12 min

87

superata

Competenze congelate all'assegnazione

PROD-001

Padronanza del prodotto

92

OBJ-003

Gestione delle obiezioni

78

COMP-014

Conformità dell'etichetta

95

Criteri valutati (rubric)

Argomentazioni basate su evidenza clinica 92
Comprensione della routine dell'HCP 85
Ripresa dopo una forte obiezione 78
Chiusura con un next step chiaro 88
Conformità dell'etichetta RDC 658 (blocker di conformità) 95

Insight IA · Punti di forza

Ha ancorato il pitch al profilo di paziente iperteso dell'HCP entro 1:15. Ha citato uno studio di fase 3 quando è stato messo in difficoltà sull'efficacia.

Aree di miglioramento

A 4:32 l'HCP ha chiesto dell'interazione con i beta-bloccanti e la risposta è stata vaga ("verifico e ti aggiorno"). Raccomandazione: formazione mirata sulle interazioni farmacologiche.

Il framework del tuo tenant

Ogni tenant ha il proprio catalogo di competenze e criteri. Clonati dai cataloghi centrali per verticale durante l'onboarding e poi completamente modificabili: aggiungi competenze specifiche del tuo business che non esistono in nessun catalogo.

L'IA assegna il punteggio. Il codice decide.

L'IA gestisce lo scoring. La regola di pass/fail è codice auditabile, inclusi i "blocker di conformità" che fanno fallire la sessione anche con un punteggio alto (es. violare l'etichetta → bocciato, anche con 95 complessivo).

Congelato per l'audit

Criteri congelati all'assegnazione. Prompt fissato a una versione specifica. Trascrizione, audio e report archiviati con retention configurabile. L'audit è incluso di serie.

Dal framework al report.

L'intera catena è deterministica e auditabile.

01

Curazione del framework

L'admin del tenant modifica competenze, criteri e contesti di scenario. Aggiungere, modificare, disattivare: tutto è versionato.

02

Il template dichiara

Nel wizard l'autore sceglie quali competenze testa ogni scenario del template. Il peso di ciascun criterio è configurabile.

03

Il roleplay congela

All'assegnazione, i criteri vengono fotografati come snapshot sul roleplay. Anche se il template viene modificato in seguito, la sessione gira contro lo snapshot.

04

L'IA valuta, il codice decide

Job asincrono: costruisce prompt e trascrizione, chiede all'IA un JSON strutturato, lo analizza, applica le regole di pass/fail, persiste l'aggregato completo.

Perché non il consensus tra più IA

Più IA non si sommano, divergono.

Lo abbiamo provato: far girare 4 modelli in parallelo e prendere la media. Il problema è che ogni modello ha un bias sistematico diverso, e la media diluisce il segnale di quello che aveva ragione.

Approccio scelto: un modello curato per ogni surface, con un prompt versionato e validato contro la rubric. Deterministico, debuggabile, comparabile tra sessioni.

Consensus multi-IA

  • ✗ 4× il costo senza 4× la confidenza
  • ✗ Diluisce i bias divergenti
  • ✗ Difficile fare il debug di un singolo punteggio
  • ✗ Diff incoerenti tra sessioni

Single-provider per surface

  • ✓ Costo controllato per chiamata
  • ✓ Prompt versionato e auditabile
  • ✓ Risultato riproducibile
  • ✓ Confronto coerente tra sessioni

Pronto a trasformare la formazione del tuo team?

Per aziende a partire da 50 collaboratori. Prenotate 45 minuti e progettiamo insieme il setup.