ChatGPT tok feil i hver fjerde medisinske vurdering - på linje med nyutdanna

- Vi kan dermed trolig se fram til å bli mindre sykmeldt i framtida, mener informatikkprofessor Jim Tørresen.

ChatGPT er på linje med en nyutdanna lege, ifølge ny studie. 📸: Gorm Kallestad / NTB
ChatGPT er på linje med en nyutdanna lege, ifølge ny studie. 📸: Gorm Kallestad / NTB Vis mer

ChatGPT er i USA testet som verktøy i helsetjenesten og traff 72 prosent korrekt i kliniske beslutninger. Det er på nivå med en nyutdannet lege.

Studien ble ledet av forskere fra Massachusetts i USA og er nylig publisert i Journal of Medical Internet Research.

ChatGPT er basert på kunstig intelligens (KI) og kan brukes til å generere svar på spørsmål og skrive samtaler. Den fikk prøve seg på å stille diagnoser og ta beslutninger om videre behandling innen alt fra akuttmedisin til primærhelsetjeneste. Hensikten var å se nærmere på hvordan KI fungerer som verktøy i helsevesenet.

Ifølge medforfatter Marc Succi viste resultatene at ChatGPT kan bistå helsepersonell gjennom hele behandlingsforløpet, fra første diagnose, via testing og konkluderende diagnose, og til rett behandling.

– Vi anslår at denne evnen er på nivå med en nyuteksaminert fra legestudiet, for eksempel leger i spesialisering, sier Succi, og mener teknologien viser potensial som verktøy i helsevesenet.

«»

Mer fakta ga bedre svar

ChatGPT presterte best når den skulle stille endelig diagnose på grunnlag av mye informasjon. Der traff den 77 prosent korrekt. Dårligst presterte den når det skulle stilles differensialdiagnose, altså se etter mulige alternativer for å forklare symptom eller funn. Da var treffprosenten 60 prosent.

ChatGPT tok rett beslutning rundt behandling og eventuell medisinering i 68 prosent av tilfellene som ble simulert.

Forskerne trekker fram at ChatGPT i motsetning til en del mennesker ikke har fordommer og ikke vil for eksempel kjønnsdiskriminere.

På den annen side er det en svakhet at den ikke er så god på differensialdiagnoser, noe Succi mener er noe av det viktigste leger gjør.

– Legene er virkelig ekspertene og bidrar med det viktigste i de tidlige stadiene av pasientbehandling, når det er knapt med informasjon, og det er nødvendig å operere ut fra en liste over mulige diagnoser, sier han.

Teknologien kommer

Vegard Slettvoll er i gang med fjerde år av medisinstudiet ved Universitet i Bergen. Han mener helsevesenet gjør seg selv en tjeneste ved å forberede seg på å bruke verktøy som ChatGPT.

– Dette er teknologi som er kommet for å bli, og det vil komme mer avanserte verktøy. Det er samtidig viktig å huske at dette er å regne som en copilot og ikke en fasit, sier han til NTB.

Han har selv trent på pasientkontakt med ChatGPT.

– Jeg brukte den til å simulere pasienter, til å øve meg på å stille diagnoser, og det fungerer som supplement, sier han.

Han tror KI allerede om ti år vil være i bruk til aktivt å sette diagnoser og finne best behandling.

– Jeg tror KI kommer til å revolusjonere hele samfunnet, sier han.

«Leger er flinke og dyktige og har god hukommelse, men kompetansen vil alltid ha begrensninger.»

Flytende overgang

Informatikkprofessor Jim Tørresen ved Universitetet i Oslo har jobbet med KI i over 20 år og leder blant annet Forskningsgruppe for robotikk og intelligente systemer. Han sier tilgang til helsetjenester og kvaliteten på tjenestene vil kunne bli bedre med hjelp fra KI.

– Leger er flinke og dyktige og har god hukommelse, men kompetansen vil alltid ha begrensninger. Det blir en flytende overgang der informasjonsteknologien vi allerede bruker i større grad, vil inkludere KI, sier Tørresen.

Han viser til at teknologi i form av internettkommunikasjon og ulike IT-løsninger alt har gjort det enklere og raskere å bestille legetime og fornye resepter.

– Styrken med nye KI-systemer som ChatGPT – og som denne studien viser – er at en kommuniserer med systemene over tid slik man ville kommunisere med en kollega, sier Tørresen.

KIs prestasjoner vil dessuten ikke påvirkes av lange skift eller nattarbeid.

– Disse chatløsningene vil kunne bistå slik at man får fortgang i prosesser rundt å stille diagnoser og bestemme behandlingsforløp. Vi kan dermed trolig se fram til å bli mindre sykmeldt i framtida om man oppdager og behandler raskere og mer korrekt, sier Tørresen.

Det sparer også samfunnet for ressurser.

Legen forsvinner ikke

Tørresen har imidlertid ikke tro på helautomatisk legekontroll og oppfølging.

– Psykiske lidelser er det for eksempel svært lite IT-løsninger for i dag, samtidig som det ofte trengs tidkrevende og persontilpasset behandling. Der sitter det nok samtidig ganske sikkert langt inne å la systemene overta for den fysiske legen, spesielt ved alvorlige og kritiske medisinske diagnoser, sier han.

Det er medisinstudenten Slettvoll enig i, enda ChatGPT tross sine feil angivelig presterte på nivå med en nyutdannet lege. Han mener det er større toleranse for at legen bommer litt.

– Det er stor enighet om at det er menneskelig å ta feil, mens med teknologien er vi vant til at den skal fungere, sier Slettvoll.