To ansatte står foran en vegg med Relis-logo i et kontor.
HALLUSINERER: Hos RELIS har vi sett mange eksempler på at referanser mangler informasjon som er gjengitt av språkmodeller, og i noen tilfeller har det vist seg at artikler ikke eksisterer. Vi må i større grad enn før sjekke at forskningen er utført, og at artikkelen ikke kun er «produsert» med kunstig intelligens, skriver Hilde Fjeld og Ruben Fossli Kufaas.

Kunstig intelligens, til bruk ved bryllupstale eller legemiddelspørsmål?

Hvis vi bruker generative språkmodeller som benytter kunstig intelligens, må all informasjon ettergås.

Publisert

Det siste året har kunstig intelligens kommet som en rakett inn i arbeidshverdagen. Til bruk ved enklere tekster som en bryllupstale er kunstig intelligens en gavepakke, hvor man får raske utkast som enkelt kan redigeres ferdig. Språkmodeller basert på kunstig intelligens kan være til hjelp også ved legemiddelspørsmål, men feltet er langt mer komplisert. ChatGPT, Copilot og OpenEvidence er eksempler på verktøy basert på kunstig intelligens og svarer basert på hva som er statistiske mønstre i treningsdata innenfor et tema. Dette innebærer at svarene er mest pålitelige når det finnes mye etablert kunnskap, mens modellene fort hallusinerer når kunnskapsgrunnlaget er begrenset.

Regionalt legemiddelinformasjonssenter (RELIS) er lokalisert på fire universitetssykehus i Oslo, Bergen, Trondheim og Tromsø og mottar daglig mange legemiddelspørsmål fra helsepersonell. Spørsmålsstillerne er i stor grad leger, både fra spesialisthelsetjenesten og primærhelsetjenesten. Bakgrunnen for våre henvendelser er ofte komplekse legemiddelrelaterte spørsmål hvor det ikke finnes et tydelig svar i en retningslinje. Ved søk innen ukjente terapiområder og ved komplekse spørsmål er det ofte vanskelig å vite hvor usikker en påstand fra en språkmodell er.

Hallusinerer forskningsartikler

Hvis vi bruker generative språkmodeller som benytter kunstig intelligens, må all informasjon ettergås. Hos RELIS har vi sett mange eksempler på at referanser mangler informasjon som er gjengitt av språkmodeller, og i noen tilfeller har det vist seg at artikler ikke eksisterer. Vi må i større grad enn før sjekke at forskningen er utført, og at artikkelen ikke kun er «produsert» med kunstig intelligens. Nyanser spiller en stor rolle når vi skal gjengi resultater fra en studie, og det er ikke alltid språkmodellene og vi velger samme valør for å beskrive et emne. Det er veldig fort gjort å bli «lurt» i en retning hvis man skal arbeide raskt.

Det finnes hjelpemidler innen feltet som øker presisjon, som hentingsforsterket generering (RAG), noe som eksempelvis plattformen Open Evidence benytter seg av. Også her måtte svarene vurderes nøye, men Open Evidence er ikke lenger tilgjengelig i UK og EU.

Bruk hodet, enten man bruker kunstig intelligens, RELIS eller en retningslinje. Godt søk!

Ingen oppgitte interessekonflikter

Powered by Labrador CMS