Viitekehyksen arviointi
Pistemäärällä on merkitystä vain, jos se on ankkuroitu
osaamisviitekehykseen.
Jokainen roolipelipohja julistaa, mitä osaamisia kukin skenaario testaa. Tekoäly pisteyttää juuri näitä kriteerejä, ei avainsanaheuristiikkaa, ei alustanlaajuista katalogia päällesi pakotettuna.
Session-raportti
Lääkärikäynti, skeptinen kardiologi
Harjoittelija: Marcela R. · Kanava: ääni · 12 min
87
hyväksytty
Osaamiset lukittu istunnon alkaessa
PROD-001
Tuotteen hallinta
92
OBJ-003
Vastalauseiden käsittely
78
COMP-014
Pakkausselosteen mukaisuus
95
Arvioidut kriteerit (rubriikki)
Tekoälyn havainnot · Vahvuudet
Ankkuroi puheenvuoron HCP:n hypertensiopotilaiden profiiliin kohdassa 1.15. Viittasi vaiheen 3 tutkimukseen, kun teho kyseenalaistettiin.
Parannettavaa
Kohdassa 4.32 HCP kysyi yhteisvaikutuksesta beetasalpaajien kanssa, ja vastaus oli epämääräinen ("tarkistan ja palaan asiaan"). Suositus: kohdennettu koulutus lääkkeiden yhteisvaikutuksista.
Asiakkaasi viitekehys
Jokaisella asiakkaalla on oma katalogi osaamisista ja kriteereistä. Kloonataan keskuskatalogeista toimialoittain onboarding-vaiheessa ja sen jälkeen täysin muokattavissa: lisäät liiketoimintasi erityisiä osaamisia, joita ei löydy mistään katalogista.
Tekoäly pisteyttää. Koodi päättää.
Tekoäly hoitaa pisteytyksen. Hyväksytty/hylätty-sääntö on auditoitavaa koodia, mukaan lukien "compliance-blockerit", jotka kaatavat session jopa korkealla pistemäärällä (esim. pakkausselosteen rikkominen → hylätty, vaikka kokonaisuudessa olisi 95).
Lukittu auditointia varten
Kriteerit lukittu istunnon alkaessa. Prompti kiinnitetty tiettyyn versioon. Transkriptio, audio ja raportti tallennetaan konfiguroitavalla säilytyksellä. Auditointi tulee laatikon mukana.
Viitekehyksestä raporttiin.
Koko ketju on deterministinen ja auditoitavissa.
01
Viitekehyksen kuratointi
Asiakkaan ylläpitäjä muokkaa osaamisia, kriteerejä ja skenaariokonteksteja. Lisäys, muokkaus, käytöstä poisto: kaikki versioitua.
02
Template julistaa
Velhossa tekijä valitsee, mitä osaamisia kukin templatessa oleva skenaario testaa. Jokaisen kriteerin paino on konfiguroitavissa.
03
Roolipeli lukittuu
Käynnistyksen yhteydessä kriteerit snapshottataan roolipeliin. Vaikka templatea muokattaisiin myöhemmin, sessio ajetaan snapshotia vasten.
04
Tekoäly pisteyttää, koodi päättää
Asynkroninen työ: rakentaa promptin ja transkriptin, pyytää tekoälyltä strukturoitua JSONia, parsii sen, soveltaa hyväksytty/hylätty-säännöt ja persistoi koko aggregaatin.
Miksi ei multi-AI-konsensusta
Useat tekoälyt eivät summautu, ne hajaantuvat.
Kokeilimme: aja 4 mallia rinnakkain ja ota keskiarvo. Ongelma on, että jokaisella mallilla on erilainen systemaattinen vinouma, ja keskiarvo laimentaa sen mallin signaalin, joka osui oikeaan.
Sen sijaan: yksi kuratoitu malli per pinta, versioidulla promptilla, joka on tarkistettu rubriikkia vasten. Deterministinen, debugattava, vertailukelpoinen sessioiden välillä.
Usean mallin konsensus
- ✗ 4-kertainen kustannus ilman 4-kertaista luottamusta
- ✗ Laimentaa hajaantuvaa vinoumaa
- ✗ Yksittäistä pistemäärää on vaikea debugata
- ✗ Epäjohdonmukainen ero sessioiden välillä
Yksi tarjoaja per pinta
- ✓ Kustannus hallinnassa kutsukohtaisesti
- ✓ Versioitu ja auditoitavissa oleva prompti
- ✓ Toistettava tulos
- ✓ Johdonmukainen vertailu sessioiden välillä
Yhteensopii hyvin
Adaptiivinen oppimispolku
Viitekehyksen aukko → automaattinen roolipeli
Tällä sivulla esitelty viitekehys on syöte, jota adaptiivinen oppimispolku käyttää osaamisaukkojen kartoittamiseen.
Lue lisää →Dashboardit
Edistyminen osaamisittain
Seuraa, kuinka jokainen tiimin jäsen nousee (tai laskee) viitekehyksen kriteereissä ajan myötä.
Lue lisää →Compliance
Tarkastusloki jokaisesta kutsusta
Prompti, malli, tokenit, kustannus, viive: kaikki kirjattu sääntelyauditointia varten.
Lue lisää →Valmiina muuttamaan, miten tiiminne kouluttautuu?
Yrityksille 50 työntekijästä alkaen. Varatkaa 45 minuuttia ja mietimme käyttöönoton yhdessä.