I år var det nok en gang testdagen, som blir avholdt én gang i året som en slags møte- og faglig påfyll-arena for mennesker som på en eller annen måte forholder seg til personlighetstesting. Denne gangen prøvde jeg liveblogging via Twitter, men fikk litt for mye #netcomfail. Så her er inntrykk i stedet.
Det var 150 fremmøtte, noe som er rimelig sensasjonelt tatt i betraktning den spede begynnelsen. Det er 150 DNV-sertifiserte testbrukere nå, og fire sertifiserte personlighetester samt et sertifisert testbatteri – OPQ32i, Shapes & Scales, Hogans Personlighets Inventorium, Master Person Analyse og B5-Plus.
Det ble poengtert at sertifisering er i ferd med å spre seg til Europa og USA, men viktig å understreke at selv om en standard eksisterer er ingen land forpliktet til å implementere den og ingen forpliktet til å bruke den, så det gjenstår fortsatt mye. Det ble også understreket en god del om interessante forskjeller mellom USA og Europa i hvordan man tenker rundt testing. I USA spiller juss en stor rolle.
Jan Kjetil Arnulfs presentasjon var ganske fantastisk. Vi vet at personlighetstesting ikke predikerer evne til lederskap veldig godt. Noe av det kommer av at vi ikke vet så mye om hva slags personlighet en god leder bør ha, eller sagt på en annen måte: Finnes det personlighetstrekk som er ønskelige eller til stede hos de fleste gode ledere (og, må vi anta, fraværende hos de dårlige)?
Arnulf foreslo at at problem er at psykologiske tester prøver å finne ting som er statiske, mens lederskap kanskje handler om evne til fleksibilitet eller tilpasning. Det er i hvert fall helt sikkert slik at det ikke er sånn at jo høyere man skårer på de egenskapene man vet er positive, jo bedre – en leder skal f.eks. være energisk, men en leder som alltid er energisk får ikke tilpasset seg situasjoner hvor det å være energisk ikke er bra – og blir f.eks. overkjærende og lite mottagelig for innspill.
Et annet problemer at i den testtradisjonen som er mest brukt for tida er begrepene hentet fra dagligtale. Kanskje må vi utvikle et teknisk språk for å beskrive, finne og måle de egenskapene som trengs. At det er noe som må måles er Arnulf enig med oss andre i, men han utfordret oss på om vi leter der vi bør lete.
Testtilbakemelding er en vikig del av testing, mener noen, fordi den kan korrigere inntrykket fra testen. Dag Øyvind Engen Nilsen er uenig, det bare tåkelegger, mener han. Dette var faktisk en aha-opplevelse for meg, for det forklarte noe jeg har lurt på i femten år og vel så det: Harald Engviks påstand om at når man kombinerer personlighetstesting med ustrukturert intervju, blir økningsvaliditeten negativ. Hvorfor i all verden?
Vel, ei testtilbakemelding er et intervju, men i hvert fall ikke et strukturert et. Og mens testen sammenligner kandidaten med et utvalg som er representativt, har verken testtilbakemelderen eller kandidaten tilgang til det. Så hvordan sjekker man om en kandidat som skårer som introvert, faktisk er det? Hvis både den som gir testtilbakemelding og den som skal testes begge kommer fra miljøer hvor det er overrepresentasjon av introverte, vil ikke de nødvendigvis ha noen god intuitiv forståelse av hva som er vanlig – og en korreksjon vil trekke i feil retning. Så nå vet jeg det: Problemet er at i testtilbakemeldingssituasjonen er sammenligningsgrunnlaget diffust. 20 år gammelt problem løst. Wheeeeeee!
Lunsjen var lang, og det var lurt: Det var høy nerdefaktor på alle presentasjonene, men under lunsjen fikk deltakerne mingle og fulgt opp mennesker de ikke hadde truffet på ei stund, og sånt er alltid et incentiv for å dra på arrangemenger som dette, men det bør jo ikke være det eneste incentivet, da.
Deretter fulgte en debatt om normativ vs. ipsativ skalering. Dette er måter å konstruere spørreskjemaer på. Her er debatten het blant testnerdene. Alle andre gir blaffen. Kandidater pleier å foretrekke normativ skalering fordi det gir skjemaer som er lettest å fylle ut. Hensikten med alternativet, ipsativ skalering, er å redusere muligheten for å bevisst eller ubevisst stille seg selv i for positivt lys når man fyller ut testen. Debatten går på om man ikke mister mer enn man tjener på denne metoden, fordi matematikken bak den gjør endel ting som kanskje ikke er så heldig. Jeg skjønte for første gang hva ipsativ skalering er (i matematisk forstand). Det var veldig oppklarende for meg og åpenbart totalt uforståelig for de fleste.
Etterpå var alle enige om at det hadde vært en fin tur.