Det første oppslaget jeg får når jeg spør Google om hva som definerer en vitenskap, er
The systematic study of the structure and behaviour of the physical and natural world through observation, experimentation, and the testing of theories against the evidence obtained.
Det kan sies mye om hvordan dette bør foregå. Men i de vitenskapene som har kunnet produsere håndfaste, pålitelige resultater, og hvor resultatene kan forklares, er eksperimenter og grunnlagsfilosofi viktig. Grunnlagsfilosofi fordi begreper må avklares for å kunne brukes (man må vite hva man snakker om), og eksperimenter for å prøve om hypotesene holder vann.
Innen de modne vitenskapene foregår eksperimenter ved at forskere prøver å bevise at de tar feil. Hvis de har fulgt alle kunstens regler og ikke klart å vise at de tar feil, så beholder de antagelsen de har prøvd å motbevise inntil videre.
Har man nok slike antagelser, og de kan brukes sammen til å forklare hvorfor antagelsene ikke kan motbevises, så har man en teori. Som evolusjon eller tyngdekraft.
Men er det sånn med psykologi?
I 2011 klarte Daryl Bem å bevise at det går an å se inn i framtida. I hvert fall bitte litte grann. Når forskere får artikler utgitt, så har de vært gjennom vurderinger av andre fagfolk innen feltet som skal hjelpe til å finne feil. Ingen fant annet enn at artikkelen hadde fulgt alle kunstens regler, og artikkelen ble trykket.
Seinere viste en matematiker at problemet med artikkelen er at psykologer ikke kan regne. I hvert fall ikke sosialpsykologer.
Dette innledet det som har vært kalt replikasjonskrisa i psykologien: Altså at en rekke berømte studier som jeg har vært nødt til å pugge og gjengi på eksamen har vært bortkastet arbeid for mitt og mange andre psykologers vedkommende.
Her er noen eksempler.
Priming og underbevisst påvirkning: John Bargh publiserte en studie i 1996 der deltakerne ble utsatt for ord relatert til eldre mennesker, og de begynte deretter å gå saktere. Dette var et eksempel på «priming», hvor eksponering for visse stimuli kan påvirke senere oppførsel. Denne studien har hatt problemer med replikasjon.
Maktposisjons-effekten (Power Posing): Amy Cuddy’s arbeid på «power posing» hevdet at å innta bestemte kroppsholdninger kunne påvirke hormonnivåene og føre til økt selvsikkerhet. Dette har også hatt problemer med replikasjon.
Sosial priming og penge-effekten: Kathleen Vohs’ studie i 2006 hevdet at bare tanken på penger kan føre til selvstendig atferd. Også dette har hatt problemer med replikasjon.
Smile-effekten: Fritz Strack’s «facial feedback» hypotese fra 1988 foreslo at å holde en penn i munnen (som tvinger ansiktet til å smile) kan gjøre mennesker mer mottakelige for humor. Dette har vist seg å være vanskelig å replikere.
Stereotype trussel: Claude Steele’s arbeid på «stereotype trussel» foreslo at å minne studenter om stereotyper knyttet til deres gruppe (f.eks. kvinner er dårlige i matematikk) kunne påvirke deres ytelse. Noen senere replikasjonsstudier har ikke funnet sterk støtte for dette fenomenet.
Ego depletion: Roy Baumeister’s teori om «ego depletion» hevdet at selvkontroll er en begrenset ressurs som kan bli utmattet. Dette har vist seg å være vanskelig å replikere i større, mer robuste studier.
Det har f.eks. vist seg at mye av grunnlaget for Daniel Kahmemans berømte «Thinking: Fast and Slow» er feil.
Dette har vært kjent – og fnyst av – lenge. I 1974 holdt Richard Feynman en tale til avgangsstudentene ved Caltech hvor han snakket om Cargo Cult Science. Hvis du lurer på hva det er for noe, så les teksten, den er kort og genial. Men i all korthet:
Under 2. verdenskrig la innbyggere ved stillehavsøyer merke til at soldatene fikk droppet varer fra lufta, fra transportfly. Dette ville de også ha, så de lagde modeller av rullebaner og kontrolltårn, og håpet at det ville komme varer til dem også.
Hvis det skal være vitenskap, er det ikke nok at det ser ut som vitenskap. Det må faktisk være vitenskap. Det er ikke nok å ha vitenskapelige tidsskrifter med tall. Noe som har vært et problem innen psykologisk forskning, er f.eks. at de statistiske analysene er for dårlige, og det har ikke vært kompetanse til å avsløre dette (se Bem ovenfor, eller Problemet med Dunning-Kruger-effekten).
Psykologiske tidsskrifter publiserer bare artikler som viser positive funn. Det betyr at hvis en forsker finner at en hypotese ikke støttes, blir ikke artikkelen publisert. Dette kalles skrivebordsskuff-effekten: Artikler som ville motbevist et positivt funn, blir liggende i skrivebordsskuffen. Tidsskriftene publiserer bare originalartikler, ikke replikasjonsstudier – som er noe av det som gjør vitenskap til vitenskap.
Det gjøres småting med dette – som at tidsskrifter begynner å kreve at hypoteser beskrives før studiene gjøres, slik at det ikke går an å endre hypotesene underveis, og at dataene innsamles av tredjepart. Likevel er det lite tegn til særlig mye bedring.
Når det gjelder personlighetspsykologi, som er det jeg gjør konsulentarbeid på, så står et langt bedre til. Det har ikke vært noen replikasjonskrise her – delvis fordi studier innen akkurat dette fagfeltet regelmessig blir replisert, og det viser seg også at personlighetspsykologer er bedre i matte enn sosialpsykologer.
Og når det gjelder klinisk psykologi? Der står det veldig dårlig til. Det er generelt risikabelt å ha tillit til studier innen klinisk psykologi. Jeg forholder meg hovedsakelig til studier som bygger på atferdsanalytisk eller personlighetspsykologisk forskning, som er det nærmeste man kommer ekte vitenskap i klinisk psykologi.