Ikke metodisk skråsikkerhet, men statistisk håndverk
Et spørsmål om statistisk håndverk handler ikke om metodisk skråsikkerhet.
Denne artikkelen er mer enn fem år gammel.

Innlegg: Per-Henrik Zahl, seniorforsker i Folkehelseinstitutt
CASSIA TREWIN-NYBRÅTEN og medarbeidere har analysert overlevelse av brystkreft og gått ut i mediene med sine hypoteser om hvorfor sosioøkonomiske forskjeller i overlevelse har forandret seg i perioden 2000–15.
Jeg kritiserte dem for å bruke «en statistisk metode som ikke kan si noe om trender i sosioøkonomiske forskjeller i dødelighet av brystkreft» fordi den statistiske metoden ikke justerer for lead-time-bias, length time-bias, stadiemigrasjon og fertilitet.
OPPSIKTSVEKKENDE. I et innlegg i Dagens Medisin forsvarer Bjørn Møller og Harald Weedon-Fekjær de statistiske analysene til Trewin og medarbeidere, og hevder at «Å tolke de epidemiologiske målene; insidensrater, mortalitetsrater og relativ overlevelse i sammenheng, er en bedre tilnærming».
Tolkning betyr her at man ser på kurvene for insidens, mortalitet og relativ overlevelse og tolker hvorfor kurvene utvikler seg forskjellig over tid. Kurvene er gruppert etter klinisk stadium og sosioøkonomiske grupper.
Min tilnærming var å foreta en standard statistisk analyse og justere for de kjente kildene til systematiske feil. Det er oppsiktsvekkende at to statistikere sier at en subjektiv fortolkning av kurver er bedre enn statistiske analyser med justering for kjente feilkilder.
SKRÅSIKKERHET? Møller og Weedon-Fekjær kritiserer meg for metodisk skråsikkerhet. Statistikk er et anvendt matematisk fag. Selv om resultatene i statistiske analyser er beheftet med usikkerhet, finnes det standarder for hva som er riktig og gal bruk av statistiske metoder, for eksempel i epidemiologi skal man alltid justere for kjente variabler som gir bias og som konfunderer.
Mitt poeng er at Trewin og medarbeidere enkelt kunne ha justert for dette, men at forskerne valgte ikke å gjøre dette. Om de finner samme resultatene i nye analyser hvor man justerer for de kjente feilkilder, betviler jeg. Alle sosioøkonomiske forskjeller ble justert vekk i en lignende analyse i perioden 1996–2001.
Summen av alle de fire feilkildene er ikke lett å forutsi
Møller og Fekjær kommer også med noen påstander om hvorfor det ikke er nødvendig å justere for disse feilkildene, men som ikke holder mål.
PROBLEMATISK. Når jeg skriver at man må justere for lead-time med å studere mortalitet, svarer de: «Utfordringen med å studere mortalitetsrater, er at de er en kombinasjon av kreftforekomst og kreftoverlevelse.» Dette er fullstendig galt. Mortalitet er definert som antallet døde per 100.000 kvinner per år, og er ikke en kombinasjon av kreftforekomst og kreftoverlevelse. Dette lærer man første året på medisinstudiet.
Når jeg skriver at de må justere for length time-bias, skriver de: «Videre er det lite som tyder på at length time-bias er et stort problem, da studien ser på kvinner under screeningalder med metastatisk sykdom». Men mange kvinner under 50 år går faktisk til mammografi, en voksende andel går til MR og studien inneholder ikke bare kvinner med metastatisk sykdom.
Jeg viser med et regneeksempel at moderne screening med MR i forhold til vanlig mammografi øker overlevelse fra 0,5 til 0,75
Dette vil jeg kalle et stort bias-problem.
STADIEMIGRASJON. Møller og Weedon-Fekjær påstår videre at det ikke er noen stadiemigrasjon.
Det er velkjent at forekomst av regional spredning har økt som følge av vaktpostlymeknute-diagnostikk. Poenget med denne teknikken er jo å finne små metastaser hos dem som tidligere ble diagnostisert uten spredning; det vil si å flytte kvinner fra gruppen uten spredning til gruppen med regional spredning.
Antallet bilder som tas per pasient, har økt, diagnostisk sensitivitet har økt betraktelig med MR og andre avanserte teknikker og flere biopsier tas. Da burde man oppdage flere kvinner med fjernmetastaser ved diagnose.
FERTILITET. Til slutt, forskerne har ikke justert for fertilitet, som er en anerkjent risikofaktor. Men dette er ikke helt enkelt å gjøre for fertile kvinner i alderen 30–49 år, fordi alder ved første fødsel ikke kan bestemmes for kvinner som enda ikke har fått sitt første barn. Man må som minimum stratifisere på barn og barnløs.
Summen av alle disse fire feilkildene er ikke lett å forutsi. For eksempel vil økt alder ved første fødsel redusere overlevelse hos dem med spredning, mens stadiemigrasjon og tidligere diagnostikk vil virke motsatt og øke overlevelsen. Tidspunkt for oppdagelse av brystkreft er avhengig av helsebevissthet, overvekt, introdusering av vaktpostlymfeknutediagnostikk, bruk av MR med mer.
Dette kaller statistikere lead-time, length time og stadiemigrasjon, og dette henger igjen sammen med sosial klasse og klinisk stadium ved diagnose. Lead-time, length time og stadiemigrasjon må man justere for på en korrekt statistisk måte. Det holder ikke med bare å kikke på figurer og stratifisere på klinisk stadium og sosioøkonomisk gruppe. Dette er for enkel bruk av statistikk.
Ingen oppgitte interessekonflikter