Når KI blir metode i medisinsk forskning
KI endrer medisinsk forskning ved å støtte tolkning og hypoteseutvikling, ikke bare analyse.
Da det internasjonale Human Genome Project startet i 1990, var ambisjonen å kartlegge hele det humane genomet i løpet av 15 år. Etter syv år, i 1997, hadde forskerne sekvensert rundt én prosent. Mange tolket dette som et tegn på et mislykket prosjekt. Teknologen Ray Kurzweil tolket situasjonen annerledes. Han pekte på at genomsekvensering allerede var blitt en informasjonsprosess, og at slike prosesser ikke er lineære. Når datamengden dobles år for år, er én prosent bare et tidlig punkt på en eksponentiell kurve.
Slik gikk det også. En første sammenhengende genomsekvens ble offentliggjort i 2000, og prosjektet ble formelt fullført i 2003, innenfor den opprinnelige tidsrammen. I ettertid er Human Genome Project blitt stående som et vendepunkt der biologi i praksis ble et informasjonsfelt. Samtidig viste de neste to tiårene at selve genomet ikke var løsningen, men et nødvendig fundament for videre metodeutvikling. Verdien lot vente på seg, fordi metodene for analyse og praktisk bruk av dataene modnet langt langsommere enn selve datainnsamlingen.
The Economist skrev i 2023 at genomprosjektet hadde transformert biologien, men at de virkelig store gevinstene i diagnostikk, behandling og helseresultater var begrensede. Potensialet var åpenbart, men ikke realisert.
Stadig mer spesialiserte dataverktøy
Det som gjør situasjonen annerledes nå, er at flere av de manglende brikkene har falt på plass siden den gang. De siste par årene har vi sett gjennombrudd i både modellskala, beregningskostnader og metodikk, særlig gjennom generative KI-modeller som kan integrere genetiske data, biologisk kunnskap og klinisk kontekst i samme arbeidsflyt. Det er først når slike metoder gjør komplekse datasett operasjonelle i praksis, at potensialet i genomikk og medisinske data faktisk kan realiseres.
Dette er ikke første gang medisinsk forskning opplever et slikt metodisk skifte. Over tid har stadig mer spesialiserte datadrevne verktøy vokst frem: grafbaserte modeller i kjemi, strukturprediksjon i biologi og maskinlæring i klinisk analyse. AlphaFold viste hvordan kombinasjonen av store datamengder og skalerbare modeller kan endre forskningsarbeid.
Det nye nå er at disse linjene begynner å samles. En fersk Nature-review viser hvordan store språkmodeller (LLMer) allerede brukes i biomedisinsk forskning og helsetjeneste. Generative modeller brukes ikke bare til tekst, men til å koble molekyler, proteiner, genetikk, sykdomsforståelse og forskningslitteratur i én sammenhengende prosess. Systematiske oversikter innen både medisinsk forskning generelt og genomikk spesielt viser at slike modeller allerede brukes til varianttolkning, annotering og hypotesegenerering, samtidig som de reduserer tiden og kostnaden i tidlige forskningsfaser.
KI som metode
I dette landskapet er TxGemma fra Google et godt eksempel på hva som nå er mulig. TxGemma er en familie av åpne KI-modeller utviklet for terapeutisk forskning, trent på små molekyler, proteiner, nukleinsyrer, sykdommer og cellelinjer. Modellene kan vurdere toksisitet og farmakokinetiske egenskaper, men det mest interessante er arbeidsformen: forskere kan stille spørsmål i naturlig språk og få forklaringer som knytter prediksjoner til kjente biologiske mekanismer. Dette gjør forskningsarbeidet mer utforskende, forklarbart og faglig dialogpreget.
I videreutviklinger inngår slike modeller i mer agentiske systemer, der flertrinnsanalyser og bruk av eksterne verktøy skjer innenfor samme sammenhengende arbeidsflyt, fremfor som separate og manuelt koblede steg.
Dette markerer et skifte fra KI som isolert analyseverktøy til KI som metode. Tyngdepunktet flyttes fra teknisk sammenstilling av analysepipelines til faglig arbeid med hypoteser, sammenhenger og prioriteringer. Det er her gjennombruddet skjer: ikke bare teknologisk, men metodisk og økonomisk, med implikasjoner for hvilke prosjekter som faktisk settes i gang, og hvilke som avsluttes tidlig.
Gjennombruddet kommer nå
I norsk sammenheng er dette særlig relevant. Norge har helseregistre og biobanker av høy kvalitet. Nye forskrifter for sekundærbruk av helsedata og europeiske rammer som EHDS gjør det nå enklere å bruke disse dataene til forskning. Med partnere som Sikt skaper dette et nytt grunnlag for tverrfaglige, dataintensive prosjekter.
Human Genome Project minner oss om at store vitenskapelige løfter ofte realiseres senere enn forventet. Verdien kommer når data, metoder og praksis modnes sammen. Vi kan se dagens utvikling innen KI i medisinsk forskning i samme lys: Potensialet har vært der lenge. Det er først nå, i 2026, at gjennombruddet faktisk begynner å gi systematiske utslag – i metode, i kostnader og, over tid, i helseresultater.
Seres oppgir ingen økonomiske eller kommersielle bindinger til KI-leverandører som omtales