
SYNTETISK: Kan kunstig genererte data bli redningen for kunstig intelligens på helsefeltet? Foto: Elnur / Shutterstock / NTB
Syntetiske data: nøkkelen til kunstig intelligens i helsetjenesten?
I dagens helsetjeneste er tilgangen til pasientdata begrenset av strenge personvernkrav og etiske retningslinjer. Her kommer syntetiske data inn i bildet.

KUNSTIG INTELLIGENS (KI) og maskinlæring (ML) har potensial til å revolusjonere helsetjenesten, men står overfor et hinder: mangel på treningsdata. I jakten på løsninger har syntetiske data blitt et (om)diskutert alternativ. Kan disse kunstig genererte dataene være redningen?
I dagens helsetjeneste er tilgangen til pasientdata begrenset av strenge personvernkrav og etiske retningslinjer. Utviklingen av ML-modeller, som kan oppdage sykdom tidlig, gi nøyaktige diagnoser, og tilby persontilpassede behandlingsforløp, krever betydelige mengder pasientdata. Her kommer syntetiske data inn i bildet.
Vi kan skape en bedre helsetjeneste med KI, men den må læres opp med gode data. Syntetiske data, kunstig skapte datasett som etterligner ekte data, tilbyr en mulig løsning på dilemmaet. Nasjonalt senter for e-helseforskning understreker imidlertid i en fersk rapport at selv om bruken av syntetiske data har potensial, finnes det også klare begrensninger.
Bruken av syntetiske data i tidlige utviklingsfaser, som senere valideres med ekte data, representerer en balanse mellom effektivitet og forsiktighet.
Kunstig intelligens er avhengig av gode treningsdata. ML-modeller kan analysere pasientjournaler, tekstnotater, medisinske bilder og genetiske data for å gi innsikt og forbedre behandlingsutfall. Mangel på reelle pasientdata bremser denne utviklingen.
SYNTETISK. Syntetiske data tilbyr en alternativ vei. Generert av spesielle ML-modeller, etterligner de statistiske egenskaper til ekte pasientdata uten å avsløre individuelle identiteter. Dette kan være et personvernvennlig alternativ til å bruke data fra ekte pasienter.
Likevel er det viktig å være klar over utfordringene knyttet til syntetiske data. Teknologien er umoden, og kvalitetssikring er avgjørende. Syntetiske pasienter må være representative for ekte pasienter, og anonymitet er ikke alltid garantert.
MÅ VALIDERES. Selv om syntetiske data kan redusere utviklingstiden for ML-modeller, må de kvalitetssikres med ekte data. Forskere kan starte modellutviklingen med syntetiske data mens de venter på tilgang til ekte data.
Dette kan spare verdifull tid, som kan gjøre veien til nye diagnostiske verktøy, nye legemidler og vaksiner kortere. Validering av modellene med ekte data forblir essensielt, spesielt for oppgaver som påvirker pasientsikkerheten.
Bruken av syntetiske data i tidlige utviklingsfaser, som senere valideres med ekte data, representerer en balanse mellom effektivitet og forsiktighet. Personvernrisiko og datakvalitet må evalueres grundig før syntetiske datasett deles. Til tross for utfordringene, kan syntetiske data være nøkkelen til å akselerere implementeringen av kunstig intelligens i helsetjenesten. Videre forskning og utvikling av bedre metoder og verktøy er nødvendig for å maksimere potensialet til syntetiske data i fremtiden.
Ingen oppgitte interessekonflikter