Glass och drunkningar samvarierar — båda ökar på sommaren. Det betyder inte att glassförsäljning orsakar drunkningsolyckor; de har en gemensam orsak i värmen. Det är ett extremt tydligt exempel på skillnaden mellan korrelation och kausalitet, och det illustrerar varför statistik i medier och reklam kräver ett kritiskt öga.
Statistik sätter siffror på verkligheten, men siffrorna är aldrig neutrala. De beror på hur urvalet gjordes, hur frågorna ställdes, och vad som utelämnades. En undersökning som frågar tio elever från samma skola kan inte dra slutsatser om hela Sveriges ungdomar — oavsett hur bra svaren var. Urvalets storlek spelar roll, men urvalets representativitet spelar ännu större roll.
Signifikans är ett annat begrepp som ofta missbrukas. Att ett resultat är statistiskt signifikant betyder att det troligen inte beror på slumpen — det säger ingenting om hur stor eller viktig skillnaden är i praktiken. 'Signifikant' i statistiken och 'signifikant' i vardagsspråket betyder olika saker, och den förväxlingen leder till dramatiska rubriker om triviala fynd.
Ur kursplanen: Exempel på hur några statistiska begrepp används i samhälle och inom vetenskap, inklusive signifikans, korrelation, kausalitet, urvalsmetoder och felkällor.
Det här lär du dig
- ✓Förklara skillnaden mellan korrelation och kausalitet med egna exempel
- ✓Bedöma om ett urval är representativt för den population man vill uttala sig om
- ✓Förstå vad statistisk signifikans innebär och vad det inte innebär
- ✓Identifiera felkällor i statistiska undersökningar som presenteras i media
- ✓Beräkna medelvärde korrekt som summan av alla värden delat på antalet
Vanliga utmaningar
Korrelation bevisar orsak och verkan
Att två saker rör sig tillsammans innebär inte att den ena orsakar den andra — båda kan ha en gemensam bakomliggande orsak. Att hitta den verkliga orsaken kräver kontrollerade experiment, inte bara en observation av ett samband.
Stort urval är automatiskt representativt
Tusen svar från ett skevt urval är sämre än hundra från ett välbalanserat. Hur du väljer deltagare avgör vad du kan säga om helheten. En stor grupp från enbart privatskolor säger ingenting om hela Sverige.
Medelvärde räknas som (första + sista) / 2
Medelvärde är summan av alla värden delat på antalet. Om fem elever fick 3, 4, 5, 5 och 8 poäng är medelvärdet (3+4+5+5+8)/5 = 5, inte (3+8)/2 = 5,5. Att läsa av bara ytterpunkterna ger fel genomsnitt.
Matte i vardagen
En hälsoapp visar att daglig träning korrelerar med lägre blodtryck hos användarna.
Det är inte säkert att träningen orsakar det lägre blodtrycket — kanske tränar redan friskare människor mer. En rubrik som 'träning sänker blodtrycket' kräver kontrollerade studier, inte bara en korrelation.
'8 av 10 ungdomar älskar det nya spelet' — baserat på tio intervjuer på en och samma skola.
Det säger ingenting om alla ungdomar i Sverige. Urvalet är varken tillräckligt stort eller tillräckligt representativt för att en sådan slutsats ska hålla.
Tips
- 💡Läs tre statistiska påståenden i dagens nyheter och ställ för varje: vem frågade, hur många, och vad kan de egentligen dra slutsatser om?
- 💡Öva på att skilja 'rör sig tillsammans' från 'orsakar' — hitta ett eget exempel på korrelation utan kausalitet och förklara vad den gemensamma orsaken kan vara.
- 💡Räkna medelvärde steg för steg: skriv ner alla värden, addera dem, dela med antalet. Hoppa aldrig till ytterpunkterna som genväg.
Exempeluppgifter
- Namnge den urvalsmetod som används i respektive situation: En person på flygplatsen delar ut frågeformulär till resenärer och ber dem utvärdera flygplatsens service. Personen frågar inte resenärer som rusar genom flygplatsen med händerna fulla av bagage, utan frågar istället alla resenärer som sitter nära gate och inte sover medan de väntar. En lärare vill veta om hennes elever gör sina läxor, så de väljer slumpmässigt rad två och fem och ber sedan alla elever i rad två och alla elever i rad fem att presentera lösningarna på läxuppgifterna för klassen. Marknadschefen för en elektronikkedja vill ha information om sina kunders åldrar. Under de kommande två veckorna får 100 slumpmässigt utvalda kunder på varje butiksort fylla i frågeformulär som frågar efter ålder samt andra variabler av intresse. Bibliotekarien på ett allmänt bibliotek vill bestämma vilken andel av bibliotekets användare som är barn. Bibliotekarien har en räknesedel där hen markerar om böcker lånas ut av en vuxen eller ett barn. Bibliotekarien registrerar dessa data för varje fjärde besökare som lånar ut böcker. Ett politiskt parti vill veta väljarnas reaktion på en debatt mellan kandidaterna. Dagen efter debatten ringer partiets opinionsundersökningspersonal till 1 200 slumpmässigt utvalda telefonnummer. Om en registrerad väljare svarar i telefonen eller är tillgänglig att komma till telefonen, frågas den registrerade väljaren vem de avser att rösta på och om debatten ändrade deras uppfattning om kandidaterna.
- favoritbasebollslag
- Nämn några praktiska svårigheter som kan uppstå när man försöker få fram exakta resultat från en enkät som skickas per post.
Testa dina kunskaper
Gör en gratis diagnos och se exakt var du behöver träna mer inom exempel på hur några statistiska begrepp används.