OK da, det er mange grunner til at journalister tar feil, og får jeg noengang tid til det, skal jeg forklare hvorfor det ikke skyldes Dunning-Kruger. Men dette er en gjenganger. Dette og baserate.
Stor overskrift i avisa: Denne klassen gjordet det best på nasjonale prøver! For noen år siden ble det slått stort opp en klasse med fem elever i som gjorde det veldig bra. Femteklassingene på Bønes Skole i Bergen skal ha gjort det veldig bra, og Bønes med 319 elever ifølge Wikipedia er større enn gjennomsnittet. Men ser du på dataene, vil det danne seg to mønstre: Skoler hvor foreldrene er høyt utdannede, og skoler som er små.
Sosiologer og journalister vil da forklare gode resultater på skoler med høyt utdannede foreldre med sosial arv, noe vi vet ikke stemmer og som ikke er tema denne gang. Sosiologer (de kan i hvert fall regne) vil være uenig med journalistene i hvorfor de små skolene får gode resultater. Det er ikke innlysende at det er fordi de er små.
Sett at du skulle inngå et veddemål om hvilket sykehus som har flest guttefødsler på et gitt døgn: Akershus Universitetssykehus, eller Finnmarkssylehuset? Sannsynligheten for gutt er 50%, så det ville vel vært et teit veddemål? Nja.
Finnmarkssykehuset har en fødsel pr. døgn i snitt, Akershus Universitetssykehus har 20. Så Finnmarkssykehuset vil ha ganske mange dager med bare én guttefødsel, mens Ahus vil ha ganske mange døgn med 50/50. Og selv om vi gikk til Kristiansund Sjukehus med et snitt på to fødsler pr. døgn, vil det oftere være overvekt av gutter enn på Ahus.
Når utvalget er lite, er sannsynligheten for ekstreme fordelinger større, fordi utslagene ikke rekker å jevne seg ut.
På sjukehus hvor det fødes få barn hvert døgn, vil det være større sannsynlighet for overvekt av guttefødsler enn på et stort sjukehus. Hvis det faktisk er to fødsler pr. døgn, vil antall mulige fordelinger være to gutter, to jenter, eller en av hver. På Ahus vil det oftest være halvparten av hvert fordi det fødes mange fler. Sannsynligheten for å få bare gutter når det er 20 som fødes er mye, mye lavere enn på Kristiansund Sjukehus hvor det fødes bare gutter med jevne mellomrom. Journalister vil da slå opp med fete typer at hvis du vil øke sannsynligheten for å få gutt, så fød på et lite sjukehus, for de vil ikke ha vett tid til å sjekke at det samme gjelder for jenter.
Regresjon mot gjennomsnittet skyldes at ekstreme utslag er mindre sannsynlige enn mindre ekstreme utslag.
I eksempelet over fører det til at størrelsen på utvalg får betydning for fordelingen av utvalget. Jo flere fødsler pr. døgn, desto større sannsynlighet for 50/50, fordi de ekstreme utslagene blir jevnet ut av de mer sannsynlige, men mindre ekstreme utslagene.
Hvis du roser ungen din for å gjøre en god jobb med å rydde rommet, vil ungen gjøre en dårligere jobb neste gang. Men hvis du skjeller ut ungen for å gjøre en dårlig jobb med å rydde rommet, vil ungen gjøre en bedre jobb neste gang. Journalister vil nøle med å konkludere med at kjeft er bedre enn ros, men vil kanskje slå det opp som et kontroversielt funn eller noe. Men årsaken er at et ekstremt utslag er mindre sannsynlig enn et mindre ekstremt utslag.
Så hvis ungen gjør en dårlig jobb med å rydde rommet, så er det et ekstremt utslag – en gjennomsnittlig jobb er mer sannsynlig. Så gjør ungen en dårlig jobb, vil neste jobb være bedre fordi det vil være mer sannsynlig. Så hva er lurt? Jo, hvis du går inn i materien, vil du se at over tid lønner det seg å rose for å gjøre en god jobb heller enn å kjefte for å gjøre en dårlig jobb. Ryddigheten av rommet vil fortsatt regredere mot gjennomsnittet, men over tid vil ryddingen regredere mot et høyere gjennomsnitt.
Om du ikke har skjønt det nå, håper jeg i det minste du er forvirret på høyere nivå.
Men … tenk om det er sant at mindre skoler fører til bedre resultater på nasjonale prøver? Da vil jo de små skolene gjøre det best?
Ja, det stemmer. Poenget er ganske enkelt at du må kunne dokumentere at fordelingen av gode resultater i små skoler er bedre enn det man kan forvente ut fra regresjon mot gjennomsnittet. Det vet jeg ikke om noen som har gjort, men det er det sikkert.