Bewertung im Rahmenwerk

Eine Punktzahl zählt nur,
wenn sie im Kompetenzrahmen verankert ist.

Jede Roleplay-Vorlage deklariert, welche Kompetenzen jedes Szenario prüft. Die KI bewertet genau diese Kriterien, ohne Keyword-Heuristiken, ohne plattformweiten Katalog, der Ihnen aufgezwungen wird.

Demo anfragen Zur Übersicht

Session-Report

Arztbesuch, skeptischer Kardiologe

Lernender: Marcela R. · Kanal: Voice · 12 Min.

bestanden

Beim Versand eingefrorene Kompetenzen

PROD-001

Produkt-Know-how

OBJ-003

Einwandbehandlung

COMP-014

Label-Konformität

Bewertete Kriterien (Rubrik)

Argumente mit klinischer Evidenz untermauert 92

Verständnis für die HCP-Routine 85

Erholung nach starkem Einwand 78

Abschluss mit klarem nächsten Schritt 88

Label-Konformität RDC 658 (Compliance-Blocker) 95

KI-Insights · Stärken

Verankerte den Pitch um 1:15 im hypertensiven Patientenprofil des HCP. Zitierte eine Phase-3-Studie bei einem Effizienz-Einwand.

Verbesserungsfelder

Bei 4:32 fragte der HCP nach Wechselwirkungen mit Betablockern, die Antwort blieb vage ("ich prüfe das und melde mich"). Empfehlung: gezieltes Training zu Arzneimittel-Interaktionen.

Das Rahmenwerk Ihres Mandanten

Jeder Mandant hat einen eigenen Katalog an Kompetenzen und Kriterien. Beim Onboarding aus den zentralen Katalogen je Branche geklont, danach vollständig editierbar, Sie ergänzen Kompetenzen, die spezifisch zu Ihrem Geschäft passen und in keinem Katalog stehen.

Die KI bewertet. Der Code entscheidet.

Die KI ist verantwortlich fürs Scoring. Die Pass/Fail-Regel ist auditierbarer Code, inklusive "Compliance-Blockern", die die Session selbst bei hoher Punktzahl scheitern lassen (z.B. Label-Verletzung führt zu Fail, auch bei 95 Gesamtwert).

Eingefroren fürs Audit

Kriterien werden beim Versand eingefroren. Prompt an eine bestimmte Version gepinnt. Transkript, Audio und Report werden mit konfigurierbarer Aufbewahrung gespeichert. Audit out of the box.

Vom Rahmenwerk zum Report.

Die gesamte Kette ist deterministisch und auditierbar.

Pflege des Rahmenwerks

Mandanten-Admin bearbeitet Kompetenzen, Kriterien und Szenario-Kontexte. Hinzufügen, ändern, deaktivieren, alles versioniert.

Vorlage deklariert

Im Wizard wählt der Autor, welche Kompetenzen jedes Szenario der Vorlage prüft. Das Gewicht jedes Kriteriums ist konfigurierbar.

Roleplay friert ein

Beim Versand werden die Kriterien als Snapshot am Roleplay verankert. Auch wenn die Vorlage später geändert wird, läuft die Session gegen den Snapshot.

KI bewertet, Code entscheidet

Async-Job: baut Prompt und Transkript, holt strukturiertes JSON von der KI, parst es, wendet Pass/Fail-Regeln an, persistiert das vollständige Aggregat.

Warum kein KI-Konsens-Verfahren

Mehrere KIs addieren sich nicht, sie driften auseinander.

Wir haben es ausprobiert: mehrere Modelle parallel laufen lassen und mitteln. Das Problem ist, dass jedes Modell einen anderen systematischen Bias hat und der Mittelwert das Signal des Modells verwässert, das es richtig hatte.

Stattdessen: ein kuratiertes Modell pro Funktion, mit versionierten Anweisungen, die auf die Rubrik abgestimmt sind. Deterministisch, nachvollziehbar, sessionübergreifend vergleichbar.

KI-Konsens-Verfahren