Hvorfor journalister tar feil: Regresjon mot gjennomsnittet

OK da, det er man­ge grun­ner til at jour­na­lis­ter tar feil, og får jeg noen­gang tid til det, skal jeg for­kla­re hvor­for det ikke skyl­des Dun­ning-Kru­ger. Men det­te er en gjen­gan­ger. Det­te og base­rate.

Stor over­skrift i avi­sa: Den­ne klas­sen gjor­det det best på nasjo­na­le prø­ver! For noen år siden ble det slått stort opp en klas­se med fem ele­ver i som gjor­de det vel­dig bra.  Fem­te­klas­sin­ge­ne på Bønes Sko­le i Ber­gen skal ha gjort det vel­dig bra, og Bønes med 319 ele­ver iføl­ge Wiki­pe­dia er stør­re enn gjen­nom­snit­tet. Men ser du på data­ene, vil det dan­ne seg to mønst­re: Sko­ler hvor for­eld­re­ne er høyt utdan­ne­de, og sko­ler som er små.

Sosio­lo­ger og jour­na­lis­ter vil da for­kla­re gode resul­ta­ter på sko­ler med høyt utdan­ne­de for­eld­re med sosi­al arv, noe vi vet ikke stem­mer og som ikke er tema den­ne gang. Sosio­lo­ger (de kan i hvert fall reg­ne) vil være uenig med jour­na­lis­te­ne i hvor­for de små sko­le­ne får gode resul­ta­ter. Det er ikke inn­ly­sen­de at det er for­di de er små.

Sett at du skul­le inn­gå et vedde­mål om hvil­ket syke­hus som har flest gutte­føds­ler på et gitt døgn: Akers­hus Uni­ver­si­tets­syke­hus, eller Finn­marks­syle­hu­set? Sann­syn­lig­he­ten for gutt er 50%, så det vil­le vel vært et teit vedde­mål?  Nja.

Finn­marks­syke­hu­set har en fød­sel pr. døgn i snitt, Akers­hus Uni­ver­si­tets­syke­hus har 20.  Så Finn­marks­syke­hu­set vil ha gans­ke man­ge dager med bare én gutte­fød­sel, mens Ahus vil ha gans­ke man­ge døgn med 50/50.  Og selv om vi gikk til Kris­tian­sund Sjuke­hus med et snitt på to føds­ler pr. døgn, vil det ofte­re være over­vekt av gut­ter enn på Ahus.

Når utval­get er lite, er sann­syn­lig­he­ten for eks­tre­me for­de­lin­ger stør­re, for­di utsla­ge­ne ikke rek­ker å jev­ne seg ut.

På sjuke­hus hvor det fødes få barn hvert døgn, vil det være stør­re sann­syn­lig­het for over­vekt av gutte­føds­ler enn på et stort sjuke­hus.  Hvis det fak­tisk er to føds­ler pr. døgn, vil antall muli­ge for­de­lin­ger være to gut­ter, to jen­ter, eller en av hver.  På Ahus vil det oftest være halv­par­ten av hvert for­di det fødes man­ge fler. Sann­syn­lig­he­ten for å få bare gut­ter når det er 20 som fødes er mye, mye lave­re enn på Kris­tian­sund Sjuke­hus hvor det fødes bare gut­ter med jev­ne mel­lom­rom.  Jour­na­lis­ter vil da slå opp med fete typer at hvis du vil øke sann­syn­lig­he­ten for å få gutt, så fød på et lite sjuke­hus, for de vil ikke ha vett tid til å sjek­ke at det sam­me gjel­der for jen­ter.

Regre­sjon mot gjen­nom­snit­tet skyl­des at eks­tre­me utslag er mind­re sann­syn­li­ge enn mind­re eks­tre­me utslag.

I eksem­pe­let over fører det til at stør­rel­sen på utvalg får betyd­ning for for­de­lin­gen av utval­get. Jo fle­re føds­ler pr. døgn, desto stør­re sann­syn­lig­het for 50/50, for­di de eks­tre­me utsla­ge­ne blir jev­net ut av de mer sann­syn­li­ge, men mind­re eks­tre­me utsla­ge­ne.

Hvis du roser ungen din for å gjø­re en god jobb med å ryd­de rom­met, vil ungen gjø­re en dår­li­ge­re jobb nes­te gang. Men hvis du skjel­ler ut ungen for å gjø­re en dår­lig jobb med å ryd­de rom­met, vil ungen gjø­re en bed­re jobb nes­te gang. Jour­na­lis­ter vil nøle med å kon­klu­de­re med at kjeft er bed­re enn ros, men vil kan­skje slå det opp som et kon­tro­ver­si­elt funn eller noe. Men årsa­ken er at et eks­tremt utslag er mind­re sann­syn­lig enn et mind­re eks­tremt utslag.

Så hvis ungen gjør en dår­lig jobb med å ryd­de rom­met, så er det et eks­tremt utslag – en gjen­nom­snitt­lig jobb er mer sann­syn­lig. Så gjør ungen en dår­lig jobb, vil nes­te jobb være bed­re for­di det vil være mer sann­syn­lig. Så hva er lurt? Jo, hvis du går inn i mate­ri­en, vil du se at over tid løn­ner det seg å rose for å gjø­re en god jobb hel­ler enn å kjef­te for å gjø­re en dår­lig jobb. Ryd­dig­he­ten av rom­met vil fort­satt regre­de­re mot gjen­nom­snit­tet, men over tid vil ryd­din­gen regre­de­re mot et høy­ere gjen­nom­snitt.

Om du ikke har skjønt det nå, håper jeg i det mins­te du er for­vir­ret på høy­ere nivå.

Men … tenk om det er sant at mind­re sko­ler fører til bed­re resul­ta­ter på nasjo­na­le prø­ver? Da vil jo de små sko­le­ne gjø­re det best?

Ja, det stem­mer. Poen­get er gans­ke enkelt at du må kun­ne doku­men­te­re at for­de­lin­gen av gode resul­ta­ter i små sko­ler er bed­re enn det man kan for­ven­te ut fra regre­sjon mot gjen­nom­snit­tet. Det vet jeg ikke om noen som har gjort, men det er det sik­kert.

nb_NONorwegian