fredag 14 september 2012

Falsk statistik?

Statistik är livsviktigt. Den ger oss en sammanfattande överblick och förståelse av verkligheten, för att kunna göra bra bedömningar inom politik, medicin, folkhälsa, ekonomi och forskning. Bra statistik lyfter fram det väsentliga, och där är kruxet – vad anser vi vara väsentligt? 


Media fylls av statistik, och sätter dagordningen. Siffror är hårda. Fakta sparkar, sägs det. Fast genom att räkna och mäta försöker man att formulera en fråga, och ingen enskild fråga kan någonsin fånga alla sidor av verkligheten. 

Siffror kan snarare vara rätt mjuka och mesiga och präglas av vad avsändaren vill ha fram ur data. Det sker både av misstag och med avsikt. Inget sensationellt med det, men då siffror alltför ofta blir sedda som objektiva är det lätt att pendeln svänger och en del börjar att misstro all statistik. Det handlar om att läsa statistiken kritiskt, och känna till några av vanligaste tricken.


Riskerna med cirkeldiagram har behandlats tidigare. Andra sätt är att använda diagrammets yta eller volym för att ge en annan bild än vad siffrorna visar. Ett annat vanligt trick är att diagrammet bara inkluderar de tidsperioder där siffrorna verkar ge som mest utslag åt diagrammakarens tes. Det är när perspektivet sträcks ut över en längre tid som det går att få en bättre bedömning av vad som skett.


En fråga inom all statistik är: jämfört med vad? Diagram kan jämföra en företeelse över tiden med något annat som ger ett bättre intryck för den tes som man vill föra fram. Det är mer raffinerat än att jämföra äpplen och päron.


Median och medelvärde är två begrepp som måste hållas åtskilda, de låter likartade men ger olika bilder av samma material. Tidigare har vi tagit upp korrelation och kausalitet, samt statistisk signifikans.


Dagens opinionsundersökningar rymmer en hel del statistiska problem. I sin bok The Nature and Origins of Mass Opinion skriver statsvetaren John Zaller:

medborgarna i allmänhet inte har bestämda åsikter på alla frågor som en opinionsundersökare kan tänkas ha; snarare skapar de upp en opinion på stället när de får en ny fråga. 

Då försöker vi passa in våra åsikter från andra frågor på den nya frågan också, eller tar in en opinion vi hört från medierna. Opinionsundersökningar är mycket dåliga på att uppfatta en underliggande opinion, och i vilken riktning den rör sig. I Sverige blir problemet större, då medierna ofta slår upp enstaka mätningar stort, och inte sammanfattningar av ett flertal.



Tage Danielsson drar nytta av Pascals trossats i sin berömda monolog Om Sannolikhet. Det finns en händelse som är så fruktansvärd att vi anser att den inte får hända under några omständigheter. Fast vi måste tänka på alternativkostnaderna. Tage Danielssons alternativ innebär mycket mer sannolika kostnader, jämfört med en osannolik kärnkraftsolycka.

Ett annat problem är publication bias, att vi inte får se alla studier som gjorts, utan bara dem som publicerats. Den tendensen är begriplig, en studie som visar att den uppställda tesen inte stämmer ger tyvärr för sällan forskaren ett erkännande. Egentligen är det minst lika viktig forskning. Då publiceras inte ett dåligt resultat, samtidigt som positiva resultat kan publiceras på mer än ett ställe, under olika former, så att det verkar finnas många studier som säger samma sak. 


Konsumentprisindex KPI är ett viktigt mått i ekonomin. Men prisförändringar kan manipuleras genom substitution, om en vara stiger i pris så förutsätter man att folk köper mindre av den och istället lägger pengarna på något som minskat i pris. Det är inte rimligt om man jämför mjölk med datorer. En prishöjning på en basvara är svår att välja bort. Kvalitetsjusteringar av produkter ges genomslag i KPI. Om TV-apparater stiger i pris med 30 procent så räknas plattskärm och nya funktioner som inte kan väljas bort (har du kunnat hitta någon gammal tjockskärms-TV till salu på sistone?) som något som sänker priset. Men funktionen på varan är den samma. Frågan är vad som ryms i den varukorg som KPI-beräkningarna grundar sig på? I USA tog man bort nybilspriserna och ersatte dem med priserna på begagnade bilar, vilket i ett slag halverade priset på bilar. Fast alla kan inte köpa en begagnad bil.


Mirakel och katastrofer säljer. Det ger rubriker, forskningsanslag och berömmelse. Exempel: en studie säger att risken för hjärtinfarkt är 50 procent högre om ditt kolesterol är högt. Usch, det låter illa. Om det istället är en extra risk att få hjärtinfarkt på 2 procent om du har högt kolesterol? Låter inte lika illa. Fast det är ju samma siffror. Jämför med om av hundra med normalt kolesterol får fyra får hjärtinfarkt. Men av hundra med högt kolesterol så får sex hjärtinfarkt. Skillnaden mellan relativa och absoluta tal är viktig, där absoluta tal innehåller mer information.

Läs även andra bloggares åsikter om , , , , , , , , ,

Intressant

The challenge between natural and artifical?

We have no right to be afraid of the future! That was the message from Corriere della Sera’s former editor Ferruccio de Bortoli, thought-pro...