Begrunda följande scenario och notera ditt intuitiva svar på frågan.
En taxi var inblandad i en smitningsolycka på kvällen.
Två taxiföretag, ett grönt och ett blått, verkar i staden.
Följande fakta finns:
• 85 procent av taxibilarna i staden är gröna och 15 procent blå.
• Ett vittne pekade ut taxibilen som blå. Domstolen prövade vittnets tillförlitlighet under samma omständigheter som rådde kvällen för olyckan och kom fram till att vittnet identifierade var och en av de båda färgerna korrekt i 80 procent av fallen och fel i 20 procent av fallen.
Vad är sannolikheten för att taxibilen som var inblandad i olyckan var blå och inte grön?
Detta är ett typexempel på Bayes inferens. Du har tillgång till två upplysningar: en relativ frekvens och det inte hundraprocentigt tillförlitliga vittnesmålet. I frånvaro av ett vittne är sannolikheten för att taxin var blå 15 procent, vilket är den relativa frekvensen för det utfallet. Om de båda taxiföretagen hade varit lika stora skulle den relativa frekvensen inte ha något informationsvärde, utan du skulle få basera din skattning helt på vittnets tillförlitlighet, vilket ger en sannolikhet på 80 procent. De båda upplysningarna kan emellertid kombineras med hjälp av Bayes sats. Det korrekta svaret är 41 procent166. Men du kan antagligen gissa vad försökspersonerna gör när de ställs inför problemet: de bortser från den relativa frekvensen och stödjer sig helt på vittnet. Det vanligaste svaret är 80 procent.
ORSAKSSTEREOTYPER
Begrunda nu en variant på samma tema, där bara beskrivningen av den relativa frekvensen har ändrats.
Följande fakta finns:
• De båda företagen har lika många taxibilar, men de gröna bilarna är inblandade i 85 procent av olyckorna.
• Informationen om vittnet är densamma som i den förra versionen.
De båda versionerna av problemet är matematiskt sett likvärdiga, men de är psykologiskt helt olika. De som får läsa den första versionen vet inte hur de ska använda den relativa frekvensen och bortser ofta från den. Men de som får se den andra versionen lägger stor vikt vid den relativa frekvensen och deras bedömningar hamnar i genomsnitt inte särskilt långt från den bayesianska lösningen167. Hur kommer det sig?
I den första versionen är de blå taxibilarnas relativa frekvens en rent statistisk uppgift om stadens taxibilar. Ett intellekt som är suget på orsaksberättelser finner där inget matnyttigt: vad har antalet gröna och blå taxibilar i staden att göra med det faktum att föraren smiter från en olycka?
I den andra versionen däremot orsakar de gröna förarna fem gånger så många olyckor som de blå. Slutsatsen är självklar: de gröna förarna måste köra som galningar! Du har nu skapat en stereotyp av grön vårdslöshet, som du tillskriver företagets chaufförer. Stereotypen är lätt att placera i en orsaksberättelse, eftersom vårdslöshet är en väsentlig kausal upplysning om en taxiförare. I den här versionen finns två orsaksberättelser som behöver kombineras eller förenas. Den första är smitningsolyckan, som förstås pekar mot att den skyldige är en vårdslös grön förare. Den andra är vittnesutsagan, som starkt pekar mot att taxin var blå. Berättelserna är alltså motstridiga och tar ut varandra. Sannolikheterna för de båda färgerna är ungefär lika höga (den bayesianska skattningen är 41 procent, vilket speglar det faktum att de gröna bilarnas relativa frekvens är något högre än tillförlitligheten hos det vittne som sade sig ha sett en blå taxi).
Taxiexemplet illustrerar två typer av relativ frekvens. Statistiska relativa frekvenser är fakta om en population som ett visst fall hör till, men de är inte intressanta för det enskilda fallet. Kausala relativa frekvenser påverkar din syn på hur det enskilda fallet kom till. De båda typerna av relativ frekvens behandlas på olika sätt:
• Statistiska relativa frekvenser ges i allmänhet för låg vikt och bortses ibland från helt och hållet när det finns specifik information om det aktuella fallet.
• Kausala relativa frekvenser behandlas som information om det enskilda fallet och kombineras enkelt med andra fallspecifika upplysningar.
Den kausala versionen av taxiproblemet hade formen av en stereotyp: gröna förare kör som vettvillingar. Stereotyper är utsagor om en grupp som (åtminstone tills vidare) accepteras som sanna för varje medlem av gruppen. Här är två exempel:
De flesta eleverna på den här innerstadsskolan läser vidare på universitet. Intresset för cykling är stort i Frankrike.
De här utsagorna tolkas lätt som att benägenheten att läsa vidare respektive tycka om cykling återfinns hos var och en av de enskilda gruppmedlemmarna. Dessutom passar de in i en orsaksberättelse. Många elever vid innerstadsskolan är ivriga och kvalificerade att läsa på universitet, antagligen för att skolan ifråga ger en bra grund för sådana ambitioner. Det finns aspekter inom fransk kultur och samhällsliv som får många fransmän att intressera sig för cykling. Du påminns om dessa omständigheter när du ska bedöma sannolikheten för att en viss elev på skolan tänker läsa på universitet eller när du undrar om du ska prata om Tour de France med en fransman du just träffat.
I vår kultur är det fult att använda stereotyper, men som jag brukar ordet är det neutralt. En grundegenskap hos System 1 är att det framställer kategorier som normer och prototyper. Det är på det viset vi föreställer oss hästar, kylskåp och New York-poliser. Vi erinrar oss en bild av en eller flera ”normala” medlemmar av respektive kategori. När kategorierna är sociala kallas dessa bilder stereotyper. En del stereotyper är fruktansvärt vilseledande, och illvilliga stereotyper kan få förskräckliga konsekvenser, men som psykologiska fakta kan de inte bortförklaras: vare sig stereotyperna är riktiga eller felaktiga hjälper de oss att tänka i termer av kategorier.
Kanske uppfattade du ironin. När man ska lösa taxiproblemet är det en kognitiv ofullkomlighet som gör att vi bortser från den relativa frekvensen, en oförmåga hos det bayesianska sättet att resonera, och i det fallet är det bättre att luta sig mot kausala relativa frekvenser. Om vi konstruerar en stereotyp av gröna förare blir vår bedömning av sannolikheten exaktare. Men i andra sammanhang, som när företag söker personal eller när man vill karakterisera en grupp, finns en stark social norm mot användning av stereotyper. Det är till och med förbjudet i lag, vilket är bra. I känsliga sociala sammanhang bör man inte dra slutsatser om en individ utifrån statistik om den grupp han eller hon tillhör. Vi anser det vara moraliskt önskvärt att relativa frekvenser behandlas som statistiska fakta om gruppen men inte som möjliga egenskaper hos enskilda individer. Med andra ord avvisar vi kausala relativa frekvenser.
Den sociala normen mot användande av stereotyper, liksom motståndet mot att sortera in människor i vissa fack, har gynnat framväxten av ett mer civiliserat och jämlikt samhälle. Men man ska komma ihåg att om man avfärdar giltiga stereotyper måste man samtidigt acceptera sämre bedömningar. Det är moraliskt lovvärt att avstå från att luta sig mot stereotyper, men den förenklade föreställningen att motståndet är gratis är felaktig. Kostnaderna är värda att betala när det handlar om att skapa ett bättre samhälle, men att förneka att det har ett pris är, även om det är själsligt tillfredsställande och politiskt korrekt, inte vetenskapligt hållbart. I politiskt laddade argument är det vanligt att man stödjer sig på affektheuristik. De ståndpunkter vi själva försvarar har inget pris, medan motståndarens inte har några fördelar. Vi borde kunna prestera bättre än så.
ORSAKSSITUATIONER
Amos och jag konstruerade varianterna på taxiproblemet, men det var inte vi som myntade begreppet kausala relativa frekvenser. Det lånade vi från psykologen Icek Ajzen. I sitt experiment visade Ajzen försökspersonerna korta personbeskrivningar av studenter som hade skrivit en tentamen vid Yale och bad dem att bedöma sannolikheten för att de hade blivit godkända. Manipuleringen av de kausala relativa frekvenserna var okomplicerad: Ajzen berättade för en grupp att studenterna de såg hade hämtats från en klass där 75 procent hade klarat tentamen, medan en annan grupp fick veta att studenterna hade hämtats från en klass där bara 25 procent hade klarat sig. Det är en stark manipulering, för de godkända studenternas relativa frekvens på bara 25 procent väcker med ens misstanken att provet måste ha varit ohyggligt svårt. Ett provs svårighetsgrad är förstås en av de orsaksfaktorer som påverkar de enskilda studenternas resultat. Som väntat var Ajzens försökspersoner mycket lyhörda för de kausala relativa frekvenserna och var och en av studenterna i den framgångsrika gruppen bedömdes ha större chans att bli godkänd än studenterna i den lågpresterande gruppen.
Ajzen använde sedan en sinnrik metod för att beskriva en ickekausal relativ frekvens. Han berättade för deltagarna att studenterna de såg hade hämtats från ett urval som i sig hade sammanställts genom att man hade valt studenterna efter deras resultat på provet (godkänt/underkänt). Informationen om den lågpresterande gruppen löd exempelvis så här:
Försöksledaren var framför allt intresserad av skälen till att studenter underkändes på skrivningar och ställde därför samman ett urval där 75 procent hade blivit underkända.
Lägg märke till skillnaden. Den här relativa frekvensen är en rent statistisk upplysning om den mängd som fallen har dragits från. Den har ingen koppling till den fråga som ställts och som handlade om huruvida den enskilde studenten klarade provet eller inte. Som väntat hade de klart formulerade relativa frekvenserna viss inverkan på bedömningarna, men de inverkade mycket mindre än de statistiskt likvärdiga kausala relativa frekvenserna. System 1 klarar att hantera berättelser där elementen är kausalt kopplade till varandra, men det är dåligt på att resonera statistiskt. För den som tänker bayesianskt är de båda versionerna förstås likvärdiga. Det är frestande att tro att vi har kommit fram till en tillfredsställande slutsats: kausala relativa frekvenser väger vi in i våra bedömningar, men statistiska fakta bortser vi (mer eller mindre) från. Nästa studie, en av mina absoluta favoriter, visar dock att det hela är lite mer komplext än så.
KAN PSYKOLOGI LÄRAS UT?
De vårdslösa taxiförarna och det gruvligt svåra provet illustrerar två slutsatser som kan dras från kausala relativa frekvenser: ett stereotypt drag som tillskrivs en individ samt en betydelsefull egenskap hos situationen som påverkar individens resultat. Deltagarna i experimenten drog de riktiga slutsatserna och gjorde bättre bedömningar. Tyvärr slutar det inte alltid så lyckligt. Det klassiska experiment jag ska beskriva härnäst visar att människor inte drar slutsatser från relativa frekvenser om slutsatserna strider mot andra övertygelser. Det stödjer också den besvärande tanken att det nästan är lönlöst att undervisa i psykologi.
Experimentet gjordes för länge sedan av socialpsykologen Richard Nisbett och hans student Eugene Borgida vid University of Michigan168. De berättade för en grupp studenter om det berömda ”undsättningsexperiment” som hade gjorts några år tidigare vid New York University. Deltagarna i experimentet placerades i avskilda bås och ombads prata i kommunikationsradion om sin personliga livssituation och sina problem. De fick tala i tur och ordning i två minuter. Bara en mikrofon var inkopplad åt gången. Det var sex deltagare i var och en av grupperna, och en av deltagarna fungerade som medhjälpare åt försöksledarna. Medhjälparen talade först enligt ett på förhand uppgjort manus. Han beskrev hur problematiskt det hade varit för honom att anpassa sig till livet i New York och erkände, synbart generad, att han ofta fick epileptiska anfall när han blev stressad. Därefter fick de övriga deltagarna tala i tur och ordning. När mikrofonen än en gång räcktes över till medhjälparen lät han upprörd och osammanhängande och sade att han var på väg att få ett anfall och behövde hjälp. Det sista som hördes från honom var: ”K-kan någon öh-öh-hjälpa-åh-åh-åh [kvävningsljud]. Jag … jag tror j-j-ag d-ö-ör … jag har ett a-a-anfall, j-jag … [han får ingen luft, sen blir det helt tyst].” Vid det laget hade nästa deltagares mikrofon kopplats in automatiskt och inget mer hördes från den kanske döende personen.
Vad tror du deltagarna i experimentet gjorde? De trodde att en av dem hade fått ett epileptiskt anfall och ville ha hjälp. Men det fanns flera andra som kunde komma till undsättning, så kanske var det säkert att sitta kvar i sitt eget bås. Resultatet blev att bara fyra av femton deltagare reagerade omedelbart på ropet på hjälp. Sex lämnade aldrig båset och fem kom ut långt efter det att ”anfallsoffret” tycktes ha kvävts till döds. Experimentet visar att människor känner sig befriade från ansvar169 när de vet att andra har hört samma rop på hjälp.
Blev du förvånad över resultatet? Antagligen. De flesta uppfattar sig som hyggliga människor som skulle skynda sig att hjälpa till i en sådan situation och vi förväntar oss att andra hyggliga människor ska göra likadant. Poängen med experimentet var förstås att visa att det är fel att förvänta sig det. Inte ens normala, hyggliga människor rusar fram och hjälper någon när de förväntar sig att andra ska ta sig an den krävande uppgiften att hjälpa en person som har fått ett epileptiskt anfall. Och det gäller dig också.
Är du beredd att skriva under på följande påstående? ”När jag läste om hur undsättningsexperimentet gick till trodde jag att jag skulle hjälpa den okända personen med en gång, vilket jag antagligen skulle ha gjort om jag hade varit ensam med den drabbade. Jag hade antagligen fel. Om jag hamnar i en situation där andra har möjlighet att hjälpa till är det inte säkert att jag träder fram. Närvaron av andra människor minskar min känsla av personligt ansvar mer än jag trodde från början.” Det är vad en psykologilärare hoppas att du skulle lära dig. Hade du dragit samma slutsatser på egen hand?
Varje professor i psykologi som redogör för undsättningsexperimentet vill att studenterna ska se den låga relativa frekvensen som kausal, precis som i exemplet med det påhittade Yaleprovet. Han vill att de ska dra slutsatsen att en överraskande hög andel underkända prov beror på att provet var ovanligt svårt. Den lärdom som studenterna förväntas dra är att en viktig egenskap hos situationen, som det ”utspädda” ansvaret, får normala och hyggliga personer som de själva att bete sig förvånansvärt ohjälpsamt.
Det är svårt att ändra uppfattning om människans natur och att ändra uppfattning om sig själv till det sämre är ännu svårare. Nisbett och Borgida misstänkte att studenterna skulle avstå från mödan och obehaget. Naturligtvis skulle studenterna kunna och vilja beskriva undsättningsexperimentet om de blev ombedda att göra det i en testsituation och de skulle till och med ”upprepa” den officiella tolkningen att ansvaret späds ut. Men förändrades verkligen deras syn på människans natur? För att ta reda på det lät Nisbett och Borgida försökspersonerna se några filmer med intervjuer som påstods föreställa två personer som hade deltagit i New York-studien. Intervjuerna var korta och alldagliga. De intervjuade personerna verkade vara trevliga, normala, hyggliga människor. De pratade om sina fritidsintressen och framtidsplaner, vilka var högst ordinära. När studenterna hade fått se en sådan intervjufilm skulle de gissa hur snabbt personen ifråga hade försökt hjälpa den insjuknade personen.
För att tänka bayesianskt kring den uppgift som studenterna fick sig tilldelad bör man först fråga sig vad man skulle ha trott om de båda personerna om man inte hade fått se intervjuerna. Svaret på den frågan får man om man studerar den relativa frekvensen. Vi har fått veta att bara 4 av de 15 deltagarna i experimentet rusade fram efter det första ropet på hjälp. Sannolikheten för att en oidentifierad deltagare skulle ha hjälpt till omedelbart är alltså 27 procent. Man bör alltså utgå från att en ospecificerad deltagare inte rusade fram och hjälpte till. Därefter säger den bayesianska logiken att man måste justera sin skattning i ljuset av väsentlig information om den enskilde deltagaren. Men filmerna var i det här fallet medvetet utformade för att säga så lite som möjligt. De gav inte betraktarna anledning att tro att personerna skulle vara vare sig mer eller mindre hjälpsamma än en slumpmässigt vald student. I frånvaron av matnyttig information kräver den bayesianska lösningen att man håller fast vid de relativa frekvenserna.
Nisbett och Borgida bad två grupper av studenter att se filmerna och förutspå hur de båda personerna skulle bete sig. Studenterna i den första gruppen fick bara information om hur undsättningsexperimentet hade gått till, inte om resultatet. Deras förutsägelser speglade deras syn på människans natur och deras uppfattning om situationen. Som man kan förvänta sig gissade de att båda personerna skulle komma till den drabbades undsättning med en gång. Den andra gruppen med studenter kände till både experimentets procedur och resultat. När de båda gruppernas förutsägelser jämfördes besvarades en viktig fråga: lärde sig studenterna något av experimentets resultat som fick dem att tänka radikalt annorlunda? Svaret är glasklart: de lärde sig inte ett dyft. Deras förutsägelser om de båda personerna gick inte att skilja från dem som gjordes av de studenter som inte visste om det statistiska resultatet av experimentet. De kände till den relativa frekvensen i den grupp som personerna hade hämtats från, men de var ändå övertygade om att personerna i filmerna hade skyndat sig att hjälpa främlingen.
För psykologilärare är studiens resultat nedslående. När vi berättar för våra studenter hur personerna i undsättningsexperimentet beter sig räknar vi med att de ska lära sig något de inte visste tidigare; vi vill att de ska ändra sin syn på hur människor beter sig i en viss situation. Det lyckades inte Nisbett och Borgida med i sin studie och det finns inget skäl att tro att resultatet skulle ha blivit annorlunda om de hade valt ett annat överraskande psykologiskt experiment. Faktum är att Nisbett och Borgida gjorde liknande upptäckter i en annan studie, där ett lätt socialt tryck fick försökspersonerna att acceptera mycket mer smärtsamma elchocker än de flesta skulle ha förväntat sig. De studenter som inte förändrar sin syn på hur den sociala miljön påverkar oss har inte lärt sig något alls av värde av experimentet. De förutsägelser de gör om slumpmässiga främlingar eller om sitt eget beteende tyder på att de inte har ändrat uppfattning om hur de skulle ha betett sig. Som Nisbett och Borgida säger ”undantar studenterna i tysthet sig själva” (och sina vänner och bekanta) från experimentens överraskande slutsatser. Men psykologilärare bör inte känna förtvivlan, för Nisbett och Borgida berättar om ett sätt att få studenterna att fatta poängen med undsättningsexperimentet. De tog en ny grupp studenter och informerade dem om hur experimentet gick till, men sade inget om resultatet. De visade de båda filmerna och berättade för studenterna att personerna de just hade sett inte hade hjälpt främlingen, varefter de bad dem gissa vad experimentet hade gett för resultat. Utfallet blev sensationellt: studenternas gissningar var ytterst exakta.
För att lära studenter något om psykologi måste man överraska dem. Men vilken sorts överraskningar ska det i så fall vara? Nisbett och Borgida fann att när de ställde sina studenter inför ett överraskande statistiskt faktum lärde de sig ingenting. Men när de överraskades av enskilda fall – två trevliga personer som inte hade hjälpt till – gjorde de omedelbart en generalisering och slöt sig till att hjälpsamhet inte är så vanligt som de hade trott. Nisbett och Borgida sammanfattade resultaten med en träffande formulering:
Försökspersonernas ovilja att dra slutsatser om det enskilda fallet utifrån det generella, motsvarades bara av deras vilja att dra generella slutsatser från det enskilda fallet.
Detta är en mycket viktig slutsats. Personer som delges överraskande statistiska fakta om mänskligt beteende kanske berättar för sina vänner om det de just fått höra, men det innebär inte att deras förståelse av världen verkligen har förändrats. Beviset för att man har lärt sig något i psykologi är att man får en ny förståelse för de situationer man hamnar i, inte att man har registrerat fakta. Det finns en djup klyfta mellan hur vi tänker kring statistik och hur vi tänker kring enskilda fall. Statistiska resultat med en kausal tolkning styr våra tankar mer än ickekausal information. Men inte ens den mest övertygande statistik rubbar gamla övertygelser eller övertygelser som grundar sig på personliga erfarenheter. Å andra sidan utövar överraskande enskilda fall ett starkt inflytande och är ett effektivare verktyg i psykologiundervisningen, eftersom den bristande överensstämmelsen måste förklaras och bäddas in i en orsaksberättelse. Det är därför den här boken innehåller frågor som vänder sig till läsaren personligen. Det är mer sannolikt att du lär dig något om du överraskas av ditt eget beteende än om du delges överraskande fakta om människor i allmänhet.
PÅ TAL OM ORSAKER OCH STATISTIK
”Vi kan inte utgå från att de lär sig något av bara statistik. Vi bör visa dem ett eller två typfall som kan påverka deras System 1.”
”Vi behöver inte oroa oss för att de ska bortse från den här statistiska upplysningen. Tvärtom kommer den med en gång att läggas till grund för en stereotyp.”