Planlegge, gjennomføre og analysere statistiske undersøkelser.
Statistiske undersøkelser brukes overalt - i forskning, politikk, media og næringsliv. For å kunne tolke og vurdere slike undersøkelser kritisk, må vi forstå hvordan de gjennomføres og hvilke feilkilder som kan oppstå.
I dette kapittelet lærer vi:
- Hvordan planlegge en undersøkelse
- Ulike utvalgsmetoder
- Hvordan analysere og presentere data
- Hvordan vurdere gyldigheten av resultater
Utvalg: Den delen av populasjonen vi faktisk undersøker
Representativt utvalg: Et utvalg som gjenspeiler populasjonen godt
Variabel: Det vi måler eller observerer (f.eks. alder, karakter, mening)
Kvantitativ variabel: Kan måles med tall (høyde, inntekt)
Kvalitativ variabel: Beskriver egenskaper (kjønn, favorittfarge)
En skole vil undersøke hvor fornøyde elevene er med kantina. De spør 50 tilfeldig valgte elever. Identifiser populasjon, utvalg og variabel.
- Populasjon: Alle elever på skolen
- Utvalg: De 50 elevene som ble spurt
- Variabel: Tilfredshet med kantina (kvalitativ variabel)
For at utvalget skal være representativt, bør de 50 elevene være tilfeldig valgt fra ulike trinn og klasser.
Identifiser populasjon, utvalg og variabel.
NRK spør 1000 nordmenn om de vil ha ny regjering.
En lege måler blodtrykket til 200 pasienter for å undersøke blodtrykk i befolkningen.
En klasse undersøker skostørrelse blant 10.-klassinger på skolen ved å måle alle i klassen.
Stratifisert utvalg: Populasjonen deles i grupper (strata), og tilfeldig utvalg trekkes fra hver gruppe. Sikrer at viktige undergrupper er representert.
Bekvemmelighetsutvalg: Man spør de som er lettest tilgjengelige. Gir ofte skjeve resultater.
Selvseleksjon: Folk velger selv å delta (f.eks. nettavstemninger). Gir skjeve resultater.
Et skjevt utvalg gjenspeiler ikke populasjonen. Dette kan skyldes:
- Bekvemmelighetsutvalg (f.eks. bare spørre venner)
- Selvseleksjon (bare engasjerte svarer)
- Systematisk frafall (visse grupper deltar ikke)
- For lite utvalg
Skjeve utvalg kan gi villedende konklusjoner!
Vurder utvalgsmetoder.
En forsker vil undersøke treningsvaner blant voksne. Hun spør folk på et treningssenter. Hva er problemet?
En nettavis ber lesere stemme på beste norske fotballspiller. Er dette representativt for nordmenns mening?
Hvordan kunne treningsforskningen i oppgave a) gjøres bedre?
Målefeil: Unøyaktige målinger eller svar
Ledende spørsmål: Spørsmålsformulering påvirker svar
Sosial ønskelighet: Folk svarer det som er "sosialt akseptabelt"
Frafall: Noen velger å ikke svare (kan være systematisk)
Tilfeldige feil: Variasjon som skyldes tilfeldigheter
En undersøkelse spør: "Er du enig i at vi bør bruke mer penger på miljøvern for å redde planeten?" 85% svarer ja. Hvilke feilkilder kan påvirke resultatet?
1. Ledende spørsmål: "redde planeten" er positivt ladet og påvirker svaret
2. Sosial ønskelighet: Folk vil fremstå miljøbevisste
3. Manglende nyanse: Spørsmålet gir ikke rom for "ja, men ikke på bekostning av X"
Bedre spørsmål: "Bør staten øke miljøbudsjettet, selv om det betyr kutt andre steder?" med svaralternativer fra "helt uenig" til "helt enig"
Identifiser feilkilder.
En undersøkelse om alkoholvaner spør folk ansikt til ansikt. Mange sier de drikker lite. Hvilken feilkilde?
Spørsmål: "Støtter du den farlige ulvejakten?" Hva er problemet?
En spørreundersøkelse har 30% svarrate. Kan dette være et problem?
Etter å ha samlet inn data, må vi analysere og presentere dem. Vi bruker:
- Sentralmål: Gjennomsnitt, median, typetall
- Spredningsmål: Variasjonsbredde, standardavvik
- Diagrammer: Søylediagram, sektordiagram, histogram, boksplott
- Tabeller: Frekvenstabeller, krysstabeller
Median: Den midterste verdien når data er sortert
Typetall (modus): Den verdien som forekommer oftest
Når bruke hva?
- Gjennomsnitt: Symmetrisk fordeling uten ekstremverdier
- Median: Skjev fordeling eller ekstremverdier
- Typetall: Kvalitative data eller når vi vil vite det vanligste
Karakterene på en prøve var: 2, 3, 3, 4, 4, 4, 5, 5, 6. Finn gjennomsnitt, median og typetall.
Gjennomsnitt:
Median:
Data er sortert. Med 9 verdier er median den 5. verdien.
Median = 4
Typetall:
4 forekommer 3 ganger (mest).
Typetall = 4
Alle tre sentralmålene er 4, noe som indikerer en symmetrisk fordeling.
Beregn sentralmål.
Alder på 8 fotballspillere: 22, 24, 25, 25, 26, 27, 29, 35. Finn gjennomsnitt og median.
Daglig skjermtid (timer): 2, 3, 3, 4, 4, 4, 5, 12. Hvilket sentralmål beskriver dataene best?
Favorittfarge blant 30 elever: rød (8), blå (12), grønn (6), gul (4). Finn typetallet.
Regn med frekvenstabeller.
Antall bøker lest siste måned: 0 (5 elever), 1 (12 elever), 2 (8 elever), 3 (4 elever), 4 (1 elev). Finn gjennomsnitt.
Fra oppgave a), finn median og typetall.
Standardavvik: Mål på gjennomsnittlig avstand fra gjennomsnittet
Et lavt standardavvik betyr at verdiene ligger nær gjennomsnittet.
Et høyt standardavvik betyr stor spredning.
Beregn spredningsmål.
Temperaturer en uke: 15, 17, 18, 20, 22, 19, 16. Finn variasjonsbredden.
To klasser har samme gjennomsnittskarakter på 4. Klasse A har standardavvik 0,5 og klasse B har 1,5. Hva forteller dette?
Når du leser om undersøkelser i media, still alltid disse spørsmålene:
1. Hvem utførte undersøkelsen? (Interessekonflikt?)
2. Hvordan ble utvalget gjort? (Representativt?)
3. Hvor stort var utvalget? (Stort nok?)
4. Hvordan var spørsmålene formulert? (Ledende?)
5. Hva var svarprosenten? (Frafall?)
6. Hva viser dataene egentlig? (Korrelasjon ≠ kausalitet!)
At to ting henger sammen (korrelerer) betyr ikke at den ene forårsaker den andre.
Eksempel: Iskremsalg og drukningsulykker korrelerer. Betyr det at iskrem forårsaker drukning? Nei! Begge påvirkes av en tredje faktor: varmt vær.
Vær alltid skeptisk til årsaksforklaringer basert på statistikk alene.
Vurder gyldigheten av undersøkelser.
En tannkremreklame sier: "80% av tannleger anbefaler vår tannkrem." Hva bør du spørre om?
En studie viser at barn som spiser frokost gjør det bedre på skolen. Kan vi konkludere at frokost gjør barn smartere?
En meningsmåling med 500 svar har feilmargin ±4%. Hva betyr dette?
Analyser presentasjon av data.
Et søylediagram viser salg fra 100 til 150 enheter, men y-aksen starter på 90. Hvordan kan dette villede?
To sektordiagram sammenlignes, men ett er mye større enn det andre. Hva er problemet?
Steg for steg:
1. Problemstilling: Hva vil vi undersøke? (Klar og avgrenset)
2. Populasjon og utvalg: Hvem vil vi si noe om, og hvem kan vi spørre?
3. Metode: Spørreskjema, intervju, observasjon, eksisterende data?
4. Datainnsamling: Utfør undersøkelsen systematisk
5. Analyse: Beregn sentralmål, lag diagrammer
6. Konklusjon: Hva viser dataene? Med hvilke forbehold?
Du vil undersøke hvor mye tid ungdomsskoleelever bruker på sosiale medier. Planlegg undersøkelsen.
1. Problemstilling: Hvor mange timer per dag bruker ungdomsskoleelever på sosiale medier, og varierer dette med klassetrinn?
2. Populasjon: Ungdomsskoleelever i Norge
Utvalg: Tilfeldig utvalg fra 3 skoler i ulike områder, stratifisert på klassetrinn
3. Metode: Anonymt digitalt spørreskjema
4. Variabler: Timer SoMe/dag (kvantitativ), klassetrinn (kvalitativ), kjønn (kvalitativ)
5. Mulige feilkilder:
- Underrapportering (sosial ønskelighet)
- Selvseleksjon hvis ikke alle svarer
- Unøyaktig estimat av egen tid
6. Analyse: Beregne gjennomsnitt og median per trinn, lage søylediagram
Planlegg undersøkelser.
Du vil undersøke om elever foretrekker gruppearbeid eller individuelt arbeid. Lag en kort plan.
Formuler 2-3 gode (nøytrale) spørsmål for undersøkelsen i a).
Tolke resultater.
En undersøkelse viser at gjennomsnitts-SoMe-tid er 3,5 timer med standardavvik 1,5 timer. Omtrent hvor mange timer bruker de fleste?
Resultatet viser at 10.-klassinger bruker mer tid enn 8.-klassinger. Hva trengs for å konkludere at dette er en trend (ikke tilfeldighet)?
Sammensatte statistikkoppgaver.
En meningsmåling om skolepolitikk får 45% ja og 55% nei, med feilmargin ±3%. Er nei-siden sikker vinner?
To undersøkelser om samme tema gir ulike resultater (40% vs 52%). Hva kan forklare forskjellen?
Du vil sammenligne søvn mellom idrettsutøvere og ikke-utøvere. Hvorfor er det vanskelig å trekke årsak-virkning-slutninger?
Utfordringsoppgave: Kritisk analyse.
En avis skriver: "Studie viser at videospill gjør barn aggressive." Undersøkelsen viste korrelasjon mellom spilletid og aggressiv adferd. Skriv en kritisk kommentar.
Design en bedre studie for å undersøke sammenhengen mellom videospill og aggresjon.