Minne fra Testdagen 2010: Personlighetstesting fra varierende perspektiver

I år var det nok en gang test­da­gen, som blir avholdt én gang i året som en slags møte- og fag­lig påfyll-are­na for men­nes­ker som på en eller annen måte for­hol­der seg til per­son­lig­hets­tes­ting. Den­ne gan­gen prøv­de jeg live­blog­ging via Twit­ter, men fikk litt for mye #net­com­fail. Så her er inn­trykk i ste­det.

Det var 150 frem­møt­te, noe som er rime­lig sen­sa­sjo­nelt tatt i betrakt­ning den spe­de begyn­nel­sen. Det er 150 DNV-ser­ti­fi­ser­te test­bru­ke­re nå, og fire ser­ti­fi­ser­te per­son­lig­he­tes­ter samt et ser­ti­fi­sert test­bat­te­ri – OPQ32i, Shapes & Sca­les, Hogans Per­son­lig­hets Invent­ori­um, Mas­ter Per­son Ana­ly­se og B5-Plus.

Det ble poeng­tert at ser­ti­fi­se­ring er i ferd med å spre seg til Euro­pa og USA, men vik­tig å under­stre­ke at selv om en stan­dard eksis­te­rer er ingen land for­plik­tet til å imple­men­te­re den og ingen for­plik­tet til å bru­ke den, så det gjen­står fort­satt mye. Det ble også under­stre­ket en god del om inter­es­san­te for­skjel­ler mel­lom USA og Euro­pa i hvor­dan man ten­ker rundt tes­ting. I USA spil­ler juss en stor rol­le.

Jan Kje­til Arnulfs pre­sen­ta­sjon var gans­ke fan­tas­tisk. Vi vet at per­son­lig­hets­tes­ting ikke pre­di­ke­rer evne til leder­skap vel­dig godt. Noe av det kom­mer av at vi ikke vet så mye om hva slags per­son­lig­het en god leder bør ha, eller sagt på en annen måte: Fin­nes det per­son­lig­hets­trekk som er øns­ke­li­ge eller til ste­de hos de fles­te gode lede­re (og, må vi anta, fra­væ­ren­de hos de dår­li­ge)?

Arnulf fore­slo at at pro­blem er at psy­ko­lo­gis­ke tes­ter prø­ver å fin­ne ting som er sta­tis­ke, mens leder­skap kan­skje hand­ler om evne til flek­si­bi­li­tet eller til­pas­ning. Det er i hvert fall helt sik­kert slik at det ikke er sånn at jo høy­ere man skå­rer på de egen­ska­pe­ne man vet er posi­ti­ve, jo bed­re – en leder skal f.eks. være ener­gisk, men en leder som all­tid er ener­gisk får ikke til­pas­set seg situa­sjo­ner hvor det å være ener­gisk ikke er bra – og blir f.eks. over­kjæ­ren­de og lite mot­ta­ge­lig for inn­spill.

Et annet pro­ble­mer at i den test­tra­di­sjo­nen som er mest brukt for tida er begre­pe­ne hen­tet fra dag­lig­tale. Kan­skje må vi utvik­le et tek­nisk språk for å beskri­ve, fin­ne og måle de egen­ska­pe­ne som trengs. At det er noe som må måles er Arnulf enig med oss and­re i, men han utford­ret oss på om vi leter der vi bør lete.

Test­til­bake­mel­ding er en vikig del av tes­ting, mener noen, for­di den kan kor­ri­ge­re inn­tryk­ket fra tes­ten. Dag Øyvind Engen Nil­sen er uenig, det bare tåke­leg­ger, mener han. Det­te var fak­tisk en aha-opp­le­vel­se for meg, for det for­klar­te noe jeg har lurt på i fem­ten år og vel så det: Harald Eng­viks påstand om at når man kom­bi­ne­rer per­son­lig­hets­tes­ting med ustruk­tu­rert inter­vju, blir økningsva­li­di­te­ten neg­a­tiv. Hvor­for i all ver­den?

Vel, ei test­til­bake­mel­ding er et inter­vju, men i hvert fall ikke et struk­tu­rert et. Og mens tes­ten sam­men­lig­ner kan­di­da­ten med et utvalg som er repre­sen­ta­tivt, har ver­ken test­til­bake­mel­de­ren eller kan­di­da­ten til­gang til det. Så hvor­dan sjek­ker man om en kan­di­dat som skå­rer som intro­vert, fak­tisk er det? Hvis både den som gir test­til­bake­mel­ding og den som skal tes­tes beg­ge kom­mer fra mil­jø­er hvor det er over­re­pre­sen­ta­sjon av intro­ver­te, vil ikke de nød­ven­dig­vis ha noen god intui­tiv for­stå­el­se av hva som er van­lig – og en kor­rek­sjon vil trek­ke i feil ret­ning. Så nå vet jeg det: Pro­ble­met er at i test­til­bake­mel­dings­si­tua­sjo­nen er sam­men­lig­nings­grunn­la­get dif­fust. 20 år gam­melt pro­blem løst. Whe­e­e­e­e­ee!

Lun­sjen var lang, og det var lurt: Det var høy nerde­fak­tor på alle pre­sen­ta­sjo­ne­ne, men under lun­sjen fikk del­ta­ker­ne ming­le og fulgt opp men­nes­ker de ikke had­de truf­fet på ei stund, og sånt er all­tid et incen­tiv for å dra på arran­ge­men­ger som det­te, men det bør jo ikke være det enes­te incen­ti­vet, da.

Der­et­ter fulg­te en debatt om nor­ma­tiv vs. ipsa­tiv ska­le­ring. Det­te er måter å kon­stru­ere spørre­skje­ma­er på. Her er debat­ten het blant test­ner­de­ne. Alle and­re gir blaf­fen. Kan­di­da­ter plei­er å fore­trek­ke nor­ma­tiv ska­le­ring for­di det gir skje­ma­er som er let­test å fyl­le ut. Hen­sik­ten med alter­na­ti­vet, ipsa­tiv ska­le­ring, er å redu­se­re mulig­he­ten for å bevisst eller ube­visst stil­le seg selv i for posi­tivt lys når man fyl­ler ut tes­ten. Debat­ten går på om man ikke mis­ter mer enn man tje­ner på den­ne meto­den, for­di mate­ma­tik­ken bak den gjør endel ting som kan­skje ikke er så hel­dig. Jeg skjøn­te for førs­te gang hva ipsa­tiv ska­le­ring er (i mate­ma­tisk for­stand). Det var vel­dig opp­kla­ren­de for meg og åpen­bart totalt ufor­ståe­lig for de fles­te.

Etter­på var alle eni­ge om at det had­de vært en fin tur.

nb_NONorwegian