En rubrik som säger "kaffedrickare lever längre" låter övertygande, men det bevisar inte att kaffe orsakar ett längre liv. Kanske är det så att välmående människor med mer fritid dricker mer kaffe och lever längre av helt andra skäl. Det är skillnaden mellan korrelation och kausalitet, och den skillnaden avgör om en slutsats är giltig eller inte.
Statistiska begrepp som signifikans, korrelation och felkällor används dagligen — i nyheter, i forskning, i marknadsföring. En opinionsundersökning som säger "53 % stöder parti X" med felmarginalen ±3 % betyder att det verkliga värdet förmodligen ligger mellan 50 % och 56 %. En ledning på 3 procentenheter mot ett annat parti är helt inom felmarginalen — skillnaden kan vara ren mätosäkerhet. Och signifikans säger att ett resultat sannolikt inte beror på slumpen, men säger ingenting om hur stor effekten är.
Urvalet är lika avgörande. Om du frågar en datorklubb om alla elevers dataintresse kan resultatet bli 92 % positiva — men det representerar bara dem som redan är intresserade. Att identifiera urvalsbias, tredjefaktorer och skillnaden mellan statistisk och praktisk betydelse är kritiskt tänkande i matematisk form.
Ur kursplanen: Exempel på hur några statistiska begrepp används i samhälle och yrkesliv, inklusive signifikans, korrelation, kausalitet, urvalsmetoder och felkällor.
Det här lär du dig
- ✓Förklara skillnaden mellan korrelation och kausalitet med egna exempel
- ✓Identifiera möjliga tredjefaktorer som kan förklara en korrelation
- ✓Läsa och tolka felmarginaler i statistiska undersökningar
- ✓Känna igen vanliga typer av urvalsbias
- ✓Skilja statistisk signifikans från praktisk relevans
Vanliga utmaningar
Korrelation tolkas som orsakssamband
Att två saker samvarierar bevisar inte att den ena orsakar den andra. Skostorlek korrelerar med läsförmåga hos barn — men det är åldern som driver båda. För varje korrelation du ser: fråga om det finns en tredje faktor som kan förklara sambandet.
Ignorerar urvalet
Resultatet av en undersökning är bara lika trovärdigt som det urval som svarade. Frågar du bara deltagarna i ett matlagningstävling om matintresse blir resultatet snett. Fråga alltid: vem tillfrågades, och vem exkluderades?
Blandar ihop statistisk signifikans och praktisk betydelse
Med tillräckligt stora urval kan miniatureffekter bli statistiskt signifikanta. En effekt på 0,2 % kan vara 'statistiskt säkerställd' men ändå irrelevant för de flesta. Fråga alltid: hur stor är effekten i verkliga enheter, inte bara om p-värdet är litet.
Matte i vardagen
Glasförsäljning och drunkningsfall ökar båda under sommaren — de korrelerar starkt.
Det är en klassisk spuriös korrelation. Tredjefaktorn är värme och sommarsäsong, som driver båda. Glass orsakar inte drunkningar.
En opinionsundersökning visar 53 % stöd för ett parti med felmarginalen ±3 %.
Det verkliga stödet kan vara allt från 50 % till 56 %. En ledning på 3 procentenheter mot ett annat parti är inom felmarginalen — resultaten är i praktiken lika.
Tips
- 💡Träna på att ställa tre frågor till statistiska påståenden: Vem undersöktes? Hur stor är effekten i verkliga enheter? Finns det en alternativ förklaring?
- 💡Leta aktivt efter tredjefaktorer. Om A och B samvarierar, fråga: finns det ett C som kan orsaka både A och B? Det avslöjar de flesta falska orsakssamband.
- 💡När du läser om en studie: kolla urvalsstorleken och hur deltagarna valdes. En studie på 50 deltagare från en specifik region är sällan generaliserbar till alla.
Exempeluppgifter
- Urvalsmetoden var a. enkel slumpmässig b. systematisk c. stratifierad d. kluster
- Forskare A drar slutsatsen att de flesta elever spelar datorspel mellan fyra och sex timmar varje vecka. Forskare B drar slutsatsen att de flesta elever spelar datorspel mellan två och fyra timmar varje vecka. Vem har rätt?
- Är ett urval på två representativt för en population på fem?
Testa dina kunskaper
Gör en gratis diagnos och se exakt var du behöver träna mer inom exempel på hur några statistiska begrepp används.