Kvinne med rutete skjerf står i solfylt park med grønt gress og trær bak.
KI-BESKYLDNINGER: Når selv spesialiserte verktøy utviklet nettopp for å identifisere KI-generert tekst fortsatt har dokumenterte utfordringer knyttet til reliabilitet og validitet, blir det relevant å spørre hvilket empirisk grunnlag som ligger til grunn når bestemte trekk ved en tekst fremheves som indikasjoner på KI-bruk, skriver Rebecka Mikkelsen.

Hvor spesifikke er egentlig tegnene på KI?

Dersom ryddighet, balanse og analytisk struktur blir brukt som indikatorer for at en tekst er KI-skapt, risikerer vi å gjøre gode faglige tekster mistenkelige nettopp fordi de er godt skrevet.

Publisert Sist oppdatert

Reidar Hjermann reagerer på Amir David Ardens kronikk om ADHD. Det står han fritt til. Faglig uenighet er en forutsetning for et levende debattklima.

Det som interesserer meg mer, er imidlertid ikke ADHD-delen av innlegget. Det er innleggets andre del om bruk av kunstig intelligens, som er heller løsrevet fra selve ADHD-debatten.

Hjermann understreker at han ikke vet om teksten er skrevet med hjelp av KI. Likevel bruker han store deler av innlegget på å beskrive trekk ved teksten som etter hans mening minner om moderne språkmodeller: tydelig struktur, pedagogisk oppbygging, balanse mellom argumenter og en konsekvent tilbakevending til hovedtesen.

Men dette reiser et metodisk problem. Er disse trekkene ved en tekst spesifikke for kunstig intelligens?

I akademia læres studenter å strukturere komplekse problemstillinger. Vi forventer at argumenter underbygges, at motargumenter vurderes og at konklusjoner følger av premissene. Det er kvaliteter som kjennetegner vitenskapelige artikler, og er også noe man kan forvente å finne i mange faglige tekster skrevet av mennesker.

Falske positive

For at et kjennetegn skal være nyttig som indikator, må det ikke bare forekomme hos dem vi ønsker å identifisere. Det må også være relativt sjeldent hos dem vi ikke ønsker å identifisere.

Ellers blir spesifisiteten lav.

Hvis både KI-genererte tekster og menneskeskrevne fagtekster ofte er velstrukturerte, balanserte og pedagogiske, vil disse kjennetegnene produsere et betydelig antall falske positive funn.

Dette er ikke bare et teoretisk problem. Weber-Wulff og kolleger testet 12 av de mest brukte KI-detektorene og konkluderte med at de tilgjengelige verktøyene var «neither accurate nor reliable» (1). En litteraturgjennomgang fra 2025 beskrev tilsvarende utfordringer knyttet til pålitelig identifikasjon av tekstforfatterskap (2). Nyere oversiktsarbeider peker dessuten på vedvarende utfordringer knyttet til validitet, generaliserbarhet og falske positive funn (3, 4). Det er en grunn til hvorfor universiteter er forsiktige med bruken av slike verktøy. Vanderbilt University valgte i 2023 å deaktivere Turnitins KI-detektor på grunn av metodiske utfordringer (5).

Når selv spesialiserte verktøy utviklet nettopp for å identifisere KI-generert tekst fortsatt har dokumenterte utfordringer knyttet til reliabilitet og validitet, blir det relevant å spørre hvilket empirisk grunnlag som ligger til grunn når bestemte trekk ved en tekst fremheves som indikasjoner på KI-bruk.  

Dersom ryddighet, balanse og analytisk struktur blir brukt som indikatorer for at en tekst er KI-skapt, risikerer vi nemlig å gjøre gode faglige tekster mistenkelige nettopp fordi de er godt skrevet.

Det vil være en uheldig utvikling- både for offentlig debatt og for tilliten mellom mennesker.

Ingen oppgitte interessekonflikter

 

Referanser

  1. Weber-Wulff D, Anohina-Naumeca A, Bjelobaba S, Foltýnek T, Guerrero-Dib J. Testing of detection tools for AI-generated text. Int J Educ Integr. 2023;19:26. https://doi.org/10.1007/s40979-023-00146-z

  2. Gotoman JEJ, Luna HLT, Sangria JCS, Santiago Jr. CS, Barbuco DD. Accuracy and Reliability of AI-Generated Text Detection Tools: A Literature Review. Am J IR 4.0 Beyond [Internett]. 2025 [sitert 2026-06-05];4(1):1-9. Tilgjengelig fra: https://journals.e-palli.com/home/index.php/ajirb/article/view/3795

  3. Deep PD. Evaluating the effectiveness and ethical implications of AI detection tools in higher education: a review. Information. 2025;16(10):905. https://doi.org/10.3390/info16100905

4.      Sun Y, Liao Y, Ma X. Trusting AI to detect AI? A systematic evaluation of the reliability and robustness of current AIGC detection tools for student academic work. Comput Educ. 2026;249:105616. DOI 10.1016/j.compedu.2026.105616

  1. Vanderbilt University. Guidance on AI Detection and Why We’re Disabling Turnitin’s AI Detector [Internett]. Nashville (TN): Vanderbilt University; 2023 [sitert 2026-06-05]. Tilgjengelig fra:https://www.vanderbilt.edu/brightspace/2023/08/16/guidance-on-ai-detection-and-why-were-disabling-turnitins-ai-detector/ 

 

 

Powered by Labrador CMS