Når jeg lærer meg ting, skriver jeg om det. Det hjelper meg å tenke. Det gjør at jeg skriver mye feil, men det er greit: Det hjelper meg å tenke, og blir feil påpekt, retter jeg dem.
Den mest vanlige bruken av statistikk innen samfunnsfag, er denne: Er to grupper like eller ikke? Dette samsvarer med den grunnleggende tesen i all vitenskap: Er observerte fenomener lovmessige eller tilfeldige? Blir pasienter virkelig mindre depressive av terapi, og kan Såsakallen kurere dårlige rygger? I begge tilfeller er det mulig å undersøke folk etter kuren, og så undersøke hvor sannsynlig det er at de faktisk ble bedre. Ble de det, er det noen underliggende lover bak, ble de ikke det, er de observerte resultatene tilfeldige.
Så sett at du gir to piller til 100 mennesker. Femti av dem får en pille som skal kurere depresjon, femti av dem får en pille som inneholder noe som ikke skal kurere depresjon. Skal du kunne gjøre statistikk på dette, må du gjøre en god del ting mer.
- De som gir fra seg pillene, må ikke selv vite hvilke piller de gir til pasientene.
- Pasientene selv må ikke vite hva slags piller de tar.
- Alle pasientenes depresjoner må være sammenlignbare.
- Alle pasientene må være så like hverandre som mulig på alle mulige områder som spiller en rolleog som ikke har med depresjonen å gjøre.
- Svarene de gir fra seg må være tilnærmet normalfordelt.
Vanligvis løser vi mesteparten av dette ved å plukke forsøkspersoner helt tilfeldig, i håp om at plukker vi mange nok helt tilfeldig, så vil de ligne så mye som mulig på de som skal bruke pillene seinere. I seinere kapitler går vi gjennom måter å sjekke om alle forutsetningene vi har forsøkt å gjøre, er gjort.
Men sett nå at vi har gjort alt riktig. Da spør vi klientene i begge gruppene hvordan de hadde det før og etter at de fikk pillene.
PÅ en skala fra 1 – 7, hvordnan har du det i dag? 1 betyr fantastisk, 7 betyr forferdelig. Så vi spør 20 pasienter, og får:
Kontrollgruppe | Eksperimentgruppe | |
---|---|---|
1 | 4.00 | 6.00 |
2 | 5.00 | 8.00 |
3 | 3.00 | 7.00 |
4 | 3.00 | 8.00 |
5 | 1.00 | 8.00 |
6 | 1.00 | 8.00 |
7 | 3.00 | 7.00 |
8 | 3.00 | 7.00 |
9 | 0.00 | 6.00 |
10 | 1.00 | 9.00 |
11 | 3.00 | 7.00 |
12 | 3.00 | 10.00 |
13 | 6.00 | 7.00 |
14 | 5.00 | 9.00 |
15 | 7.00 | 8.00 |
16 | 4.00 | 7.00 |
17 | 6.00 | 7.00 |
18 | 3.00 | 9.00 |
19 | 2.00 | 5.00 |
20 | 3.00 | 8.00 |
OK, så hva kan vi vite – er det forskjell på gruppene etter behandling? Til dette bruker vi, siden vi er nybegynnere, Students t‑test.
Student het ikke egentlig dét, han het William Sealy Gosset og jobbet for bryggeriet Guinnes. Han publiserte i vitenskapelige tidsskrift, og da brukte han pseudonymet Student, siden Guinnes ikke tillot forskerne sine å publisere, fordi de ikke ville at konkurrentene skulle oppdage at de jobbet vitenskapelig.
Så her er den første lille introduksjon til hypotesetesting: Virket pillen eller ikke? Du har to hypoteser i utgangspunktet. Den ene heter alltid null-hypotesen (H0) og er er at den ikke virket (og at forskjeller mellom gruppene er tilfeldige). Den andre er heter H1 og er at den virket (og at forskjeller mellom gruppene er lovmessige).
I testen til Student gjør vi som følger:
> # Legg hver kolonne inn i hver sin variabel > Q1 Q2 # Slå dem sammen > Q # Sett fornuftige navn på kolonnene > colnames(Q) # Vis dataene > Q Før Etter [1,] 4 6 [2,] 5 8 [3,] 3 7 [4,] 3 8 [5,] 1 8 [6,] 1 8 [7,] 3 7 [8,] 3 7 [9,] 0 6 [10,] 1 9 [11,] 3 7 [12,] 3 10 [13,] 6 7 [14,] 5 9 [15,] 7 8 [16,] 4 7 [17,] 6 7 [18,] 3 9 [19,] 2 5 [20,] 3 8 > # Kjør t-test! > t.test(Q1,Q2,var.equal=TRUE) Two Sample t-test data: Q1 and Q2 t = -8.6777, df = 38, p-value = 1.507e-10 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.241475 -3.258525 sample estimates: mean of x mean of y 3.30 7.55 >
Alternativt kan du bruke SPSS eller Minitab, men R er gratis.
Hva kan vi slutte av dette?
p‑verdien er svært, svært liten. Er den lavere enn 0.05 (det er bare en konvensjon vi har), kan vi anta at vi ikke har klart å sannsynligjøre at forskjellene er tilfeldige. Negativ t‑verdi betyr at gruppe 2 hadde høyest gjennomsnitt. I våre dager rapporterer vi sjelden t‑verdien: p‑verdien er en funksjon av t‑verdien og det er den som er interessant. Når |t| (verdien av t uten fortegnet) går opp, går p ned.
Det p‑verdien svarer på, er følgende spørsmål:
Hva er sannsynligheten for å få en t‑verdi i hvert fall så stor som denne dersom H_0 er sann?
Så hva er det vi har svart på ovenfor? Jo, vi har spurt naturen: Virker ikke denne pillen? Og naturen har svart: Vi har ikke god nok grunn til å avvise at pillen virker.