Pasientsikkerhetskultur og uheldige hendelser

Min studie tyder på at spørreskjemaer for å måle pasientsikkerhetskulturen – og Global Trigger Tool (GTT) for å måle uheldige hendelser – har betydelige svakheter.

Publisert

Denne artikkelen er mer enn fem år gammel.

Per G. Farup, professor, DMF, NTNU i Trondheim og forskningsrådgiver ved Sykehuset Innlandet, Gjøvik
HØY pasientsikkerhet er viktig. Det er derfor gledelig at min artikkel, omtalt i Dagens Medisin og i to påfølgende debattinnlegg i samme avis, har fått oppmerksomhet.

Sekretariatsleder Anne-Grete Skjellanger, som antakelig uttaler seg på vegne av Det Nasjonale Pasientsikkerhetsprogrammet I Trygge Hender, uttaler at hun ikke er overrasket over at avdelingen med den høyeste pasientsikkerhetskulturen hadde den høyeste forekomsten av uheldige hendelser. Er det slik det skal være i følge «I Trygge Hender»?
EN ÆRLIG SAK. I motsetning til hva Skjellanger skriver, er funnene helt reelle – jeg håper hun ikke beskylder meg for fusk. Og hvis funnene ikke er relevante for Det Nasjonale Pasientsikkerhetsprogrammet, bør de tenke seg om.
Skjellanger forsøker å forklare hvorfor funnene ikke er riktige. Det er en ærlig sak, for funnene passer ikke med det man venter å finne. Dette diskuteres også i artikkelen i BMC Health Services Research. Den mest sannsynlige forklaringen er, slik Skjellanger påpeker, at instrumentene for måling av pasientsikkerhetskulturen og uheldige hendelser, ikke er egnet.
PÅLITELIGHET. Skjellanger påpeker at skjemaet vi har brukt for måling av kulturen, Hospital Survey on Patient Safety Culture (HSOPSC), ikke er egnet til å måle kulturen på enhetsnivå. Dette er nytt for meg, og jeg har ikke funnet noen dokumentasjon for at det stemmer.
Skjemaet er oversatt til mange språk og er i utstrakt bruk over hele verden. Det måler kulturen både på sykehusnivå og enhetsnivå og er brukt i overensstemmelse med brukermanualen. Dette i motsetning til Pasientsikkerhetskampanjen, som bare bruker en begrenset del av skjemaet Safety Attitudes Questionnaire (SAQ).
SVAKHETER. En slik bruk av en del av et skjema reduserer validiteten betydelig. En nærliggende forklaring på mitt funn er at pasientsikkerhetskultur målt med et spørreskjema, uavhengig av om man velger det ene eller andre skjemaet, er en upålitelig indikator for den virkelige sikkerheten.
Det henvises til flere anerkjente studier som viser sammenheng mellom kulturen og uheldige hendelser. Jeg tror jeg kjenner alle, og de har store metodologiske svakheter. Nesten uten unntak er målingene av kulturen og uheldige hendelser gjort på en slik måte at de er avhengige av hverandre. Ekstern validitet av et spørreskjema kan bare vurderes når målingene er uavhengige av hverandre, slik de er i min studie.
GTT. Det argumenteres med at alle norske helseforetak bruker Global Trigger Tool (GTT). Ja – det gjør de fordi det føles som en pålagt oppgave, men det er ikke et bevis for at GTT er egnet. Det bør være kjent for Pasientsikkerhetsprogrammet at sykehus i utlandet har forkastet metoden. Jeg tror også at det er den beste metoden vi har, men dette fritar oss ikke fra å vurdere hvor god den er, og om den brukes riktig.
Som det ganske riktig påpekes, skal metoden brukes på samme måte, av samme team, og med samme definisjoner. Det er nettopp det jeg gjorde i min studie, men jeg vet at dette ikke skjer i den daglige bruken av GTT på sykehusene. Fordi metoden ble utviklet for bruk i operative enheter, kan man også sette spørsmålstegn ved om den er egnet til bruk i andre avdelinger, for eksempel medisinske avdelinger, slik jeg gjorde.
UHELDIGE HENDELSER. Fagsjef Tonje Elisabeth Hansen ved Nordlandssykehuset påpeker helt riktig at GTT måler ikke feil, men uheldige hendelser. I artikkelen bruker jeg ordet «adverse events». Det er Dagens Medisin som oversetter det til feil. Det er også riktig, som Hansen påpeker, at GTT ikke avdekker alle uheldige hendelser. Men dette er uten betydning i sammenligninger mellom avdelinger hvis andelen av uheldige hendelser som avdekkes, er den samme.
Når metoden er brukt korrekt, slik beskrevet ovenfor, i to like avdelinger, bør andelen av uheldige hendelser som avdekkes, være den samme. Hvis Hansen leser artikkelen en gang til, vil hun se at det er redegjort for at forskjeller i pasientpopulasjon (kreftpasienter), administrativt personell, erfaring med GTT og sykdomskompleksitet (målt ved DRG) ikke påvirket resultatene. Det var et lite materiale, men sannsynligheten for et falskt positivt resultat var på 1.4 prosent etter korrigering for de nevnte variablene.
FARLIGE TESER. Hansen mener at avviksmeldingene som helsepersonell selv rapporterer, ville ha vært et bedre mål enn GTT. Jeg tror det er enighet om at det ikke er riktig, og at dette er en av grunnene til at man bruker GTT. Fagsjefens konklusjon om at studien ikke gir svar på styrker eller svakheter ved verktøyene fordi resultatet ikke passer med tesen, faller på sin urimelighet. «Teser» som ikke er vitenskapelig dokumentert er «livsfarlige», og studier som ikke passer med «tesen», kan ikke forkastes av den grunn.
Vi er sikkert enige om at pasientsikkerhet er viktig og bør forbedres, og at vi må finne de beste måtene for å forbedre – og måle pasientsikkerheten på. Min studie tyder på at slik det gjøres i dag, med spørreskjemaer for å måle kulturen og GTT for måling av uheldige hendelser, har betydelige svakheter.
Ingen oppgitte interessekonflikter

Powered by Labrador CMS