For dårlige subgruppeanalyser

Publisering av resultater fra subgruppeanalyser i randomiserte studier er vanlig, men altfor dårlig dokumentert.

Publisert

Denne artikkelen er mer enn 10 år gammel.

Dette viser en studie som nylig ble publisert i British Medical Journal (Sun et al).
Forskerne har sett på resultater fra subgruppeanalyser i publiserte randomiserte studier i de mest prestisjetunge medisinske tidsskriftene.
Kriterier ikke oppfylt
Fra 40-65 prosent av randomiserte studier (RCT) publiserer resultater fra subgruppeanalyser. Artikkelforfatterne henviser til ti kriterier for høy troverdighet ved slike analyser og fant at de ikke var oppfylt for mange av studiene. 
Blant 207 studier var det 31 prosent som rapporterte forskjeller i subgrupper i forhold til de samlede resultatene i studien. Av disse 64 studiene var det hele 84 prosent som bare oppfylte fire eller færre av ti definerte kriteriene. Bare tre av studiene oppfylte over fem kriterier.
Ukritisk tolkning
Bare halvparten av de 64 studiene rapporterte at de hadde gjort en såkalt «test of interaction», en beregning av sannsynligheten for at en observert forskjell i effekt kunne ha oppstått ved en tilfeldighet. Bare ni prosent av studiene hadde testet og kom til et statistisk signifikant resultat.
Forsker Andrew D. Oxman ved Kunnskapssenteret i Norge skriver i en lederkommentar til BMJ-studien at subgruppeforskjeller er for dårlig dokumentert og blir ukritisk tolket.
- De trolig vanligste konsekvensene er at pasientgrupper, med bakgrunn i subgrupperesultater, ikke får en behandling på grunn av feilaktig påstått manglende effekt, uttaler Oxman til Dagens Medisin.
Alvorlige konsekvenser
Han viser til at kvinner med høy risiko for hjerneslag i mange år ikke fikk forebyggende platehemmende behandling fordi en subgruppeanalyse i en større studie bare viste effekt for menn. Dette viste seg imidlertid å være feil.
- Det kan også gå andre veien, at grupper ikke bør ha en behandling. Det kan skje, for eksempel når de samlede resultatene ikke viser statistisk signifikant effekt - og forskerne leter etter en effekt i undergrupper av pasienter. Vi har dårlig dokumentasjon for hvor ofte klinikerne bruker resultater fra subgruppeanalyser - og hvor ofte feil tolkning fører til feil behandling.
Svakheter
- Hva er den vanligste feilen som gjøres ved subgruppeanalyser?
- Foruten at de ikke gjør en test av samspill, er det ofte at studien er for liten til å kunne beregne sikker statistisk signifikans. Da vil resultatene fra subgruppeanalyser i stor grad være tilfeldige. Den andre viktige svakheten er at de kjører subgruppeanalyser uten hypotese eller empirisk grunnlag, og i slike tilfeller er sannsynligheten for tilfeldige funn enda større, svarer Oxman.
Kilde: BMJ 2012;344:e1553
Forskning, Dagens Medisin 06/2012

Powered by Labrador CMS