Keretrendszer-értékelés

A pontszám csak akkor számít, ha a
kompetenciakerethez van rögzítve.

Minden roleplay-sablon deklarálja, hogy az egyes forgatókönyvek mely kompetenciákat tesztelik. Az AI pontosan ezeket a kritériumokat pontozza, kulcsszó-heurisztika nélkül, és a platform sem kényszerít rá egy katalógust.

Demó kérése Vissza az áttekintéshez

Munkamenet-jelentés

Orvoslátogatás, szkeptikus kardiológus

Gyakornok: Marcela R. · Csatorna: hang · 12 perc

teljesítve

Kompetenciák a futtatáskor rögzítve

PROD-001

Termékismeret

OBJ-003

Kifogáskezelés

COMP-014

Címkebetartás

Értékelt kritériumok (rubrik)

Klinikai bizonyítékokra épülő érvek 92

A HCP rutinjának ismerete 85

Helyreállás egy erős kifogás után 78

Lezárás konkrét következő lépéssel 88

RDC 658 címkebetartás (compliance blokkoló) 95

AI elemzés · Erősségek

A pitch-et 1:15-kor a HCP magas vérnyomású betegprofiljához kötötte. Egy 3. fázisú vizsgálatra hivatkozott a hatékonysági kihívás során.

Fejlesztendő területek

4:32-nél a HCP a béta-blokkolókkal való interakcióról kérdezett, és a válasz homályos volt ("Megnézem, és visszatérek rá"). Javaslat: célzott képzés a gyógyszer-interakciókról.

Az Ön tenantjának keretrendszere

Minden tenantnak saját katalógusa van a kompetenciákból és kritériumokból. Onboardingkor a vertikum szerinti központi katalógusokból klónozva, majd teljesen szerkeszthetően, Ön hozzáadhatja az üzletspecifikus kompetenciákat, amelyek egyetlen katalógusban sem szerepelnek.

Az AI pontoz. A kód dönt.

Az AI feladata a pontozás. A pass/fail szabály auditálható kód, beleértve a "compliance blokkolókat", amelyek magas pontszám mellett is bukásra ítélik a munkamenetet (pl. címkesértés esetén 95-ös összpontszám mellett is fail).

Audithoz rögzítve

Kritériumok a futtatáskor rögzítve. A prompt egy konkrét verzióra horgonyozva. Átirat, audio és jelentés konfigurálható megőrzéssel tárolva. Az audit out-of-the-box.

A keretrendszertől a jelentésig.

A teljes lánc determinisztikus és auditálható.

Keretrendszer-kurálás

A tenant adminja szerkeszti a kompetenciákat, a kritériumokat és a forgatókönyv-kontextusokat. Hozzáadás, szerkesztés, deaktiválás, minden verziókövetett.

A sablon deklarál

A varázslóban a szerző kiválasztja, hogy a sablon egyes forgatókönyvei mely kompetenciákat tesztelik. Minden kritérium súlya konfigurálható.

A roleplay rögzíti

A futtatáskor a kritériumok snapshotba kerülnek a roleplay-ben. A sablon későbbi szerkesztése sem érinti a munkamenetet, amely a snapshot ellen fut.

Az AI pontoz, a kód dönt

Aszinkron job: összerakja a promptot és az átiratot, strukturált JSON-t kér az AI-tól, parsolja, alkalmazza a pass/fail szabályokat, és teljes aggregátumot perzisztál.

Miért nem multi-AI konszenzus

Több AI nem ad össze, hanem szétszórja.

Kipróbáltuk: 4 modellt párhuzamosan futtattunk, és átlagot vettünk. A probléma az, hogy minden modellnek más szisztematikus torzítása van, és az átlag felhígítja annak a modellnek a jelét, amelyik eltalálta.

Helyette: felületenként egy kurált modell, verziókövetett, a rubrikhoz validált prompttal. Determinisztikus, hibakereshető, munkamenetek között összehasonlítható.

Több modelles konszenzus