Viitekehyksen arviointi

Pistemäärällä on merkitystä vain, jos se on ankkuroitu
osaamisviitekehykseen.

Jokainen roolipelipohja julistaa, mitä osaamisia kukin skenaario testaa. Tekoäly pisteyttää juuri näitä kriteerejä, ei avainsanaheuristiikkaa, ei alustanlaajuista katalogia päällesi pakotettuna.

Pyydä demo Takaisin yleiskatsaukseen

Session-raportti

Lääkärikäynti, skeptinen kardiologi

Harjoittelija: Marcela R. · Kanava: ääni · 12 min

hyväksytty

Osaamiset lukittu istunnon alkaessa

PROD-001

Tuotteen hallinta

OBJ-003

Vastalauseiden käsittely

COMP-014

Pakkausselosteen mukaisuus

Arvioidut kriteerit (rubriikki)

Argumentit kliinisen näytön pohjalta 92

Ymmärrys terveydenhuollon ammattilaisen arjesta 85

Palautuminen vahvan vastalauseen jälkeen 78

Sulkeminen selkeällä jatkoaskelmalla 88

Pakkausselosteen mukaisuus RDC 658 (compliance-blocker) 95

Tekoälyn havainnot · Vahvuudet

Ankkuroi puheenvuoron HCP:n hypertensiopotilaiden profiiliin kohdassa 1.15. Viittasi vaiheen 3 tutkimukseen, kun teho kyseenalaistettiin.

Parannettavaa

Kohdassa 4.32 HCP kysyi yhteisvaikutuksesta beetasalpaajien kanssa, ja vastaus oli epämääräinen ("tarkistan ja palaan asiaan"). Suositus: kohdennettu koulutus lääkkeiden yhteisvaikutuksista.

Asiakkaasi viitekehys

Jokaisella asiakkaalla on oma katalogi osaamisista ja kriteereistä. Kloonataan keskuskatalogeista toimialoittain onboarding-vaiheessa ja sen jälkeen täysin muokattavissa: lisäät liiketoimintasi erityisiä osaamisia, joita ei löydy mistään katalogista.

Tekoäly pisteyttää. Koodi päättää.

Tekoäly hoitaa pisteytyksen. Hyväksytty/hylätty-sääntö on auditoitavaa koodia, mukaan lukien "compliance-blockerit", jotka kaatavat session jopa korkealla pistemäärällä (esim. pakkausselosteen rikkominen → hylätty, vaikka kokonaisuudessa olisi 95).

Lukittu auditointia varten

Kriteerit lukittu istunnon alkaessa. Prompti kiinnitetty tiettyyn versioon. Transkriptio, audio ja raportti tallennetaan konfiguroitavalla säilytyksellä. Auditointi tulee laatikon mukana.

Viitekehyksestä raporttiin.

Koko ketju on deterministinen ja auditoitavissa.

Viitekehyksen kuratointi

Asiakkaan ylläpitäjä muokkaa osaamisia, kriteerejä ja skenaariokonteksteja. Lisäys, muokkaus, käytöstä poisto: kaikki versioitua.

Template julistaa

Velhossa tekijä valitsee, mitä osaamisia kukin templatessa oleva skenaario testaa. Jokaisen kriteerin paino on konfiguroitavissa.

Roolipeli lukittuu

Käynnistyksen yhteydessä kriteerit snapshottataan roolipeliin. Vaikka templatea muokattaisiin myöhemmin, sessio ajetaan snapshotia vasten.

Tekoäly pisteyttää, koodi päättää

Asynkroninen työ: rakentaa promptin ja transkriptin, pyytää tekoälyltä strukturoitua JSONia, parsii sen, soveltaa hyväksytty/hylätty-säännöt ja persistoi koko aggregaatin.

Miksi ei multi-AI-konsensusta

Useat tekoälyt eivät summautu, ne hajaantuvat.

Kokeilimme: aja 4 mallia rinnakkain ja ota keskiarvo. Ongelma on, että jokaisella mallilla on erilainen systemaattinen vinouma, ja keskiarvo laimentaa sen mallin signaalin, joka osui oikeaan.

Sen sijaan: yksi kuratoitu malli per pinta, versioidulla promptilla, joka on tarkistettu rubriikkia vasten. Deterministinen, debugattava, vertailukelpoinen sessioiden välillä.

Usean mallin konsensus