0% fullført
Kapittel 10.1
S2Lær om normalfordelingen og hvordan du kan bruke den til å analysere data.
Normalfordelingen er en av de viktigste fordelingene i statistikk. Den beskriver hvordan mange naturlige fenomener er fordelt: høyde, vekt, testresultater, målefeil, osv.
Z-score forteller oss hvor mange standardavvik en verdi er fra gjennomsnittet. Dette er veldig nyttig for å sammenligne verdier fra forskjellige datasett.
z = (x - μ) / σ
der x = observert verdi, μ = gjennomsnitt, σ = standardavvik
Vi kan bruke en forenklet versjon av normalfordelingens tetthetsfunksjon til å visualisere fordelingen:
Grafen viser den karakteristiske klokkeformen. Mest sannsynlige verdier er nær gjennomsnittet (x = 0).
Høyden til norske menn er normalfordelt med μ = 179 cm og σ = 7 cm.
Beregn Z-score for en mann som er 186 cm høy.
Beregn Z-score for en mann som er 165 cm høy.
Hvilken høyde tilsvarer z = 2?
Lag en tetthetsfunksjon for normalfordeling og test den.
Implementer normal_pdf(x, mu, sigma) funksjonen.
Test med μ = 10, σ = 2 for verdier fra 6 til 14.
Hva er verdien av funksjonen ved x = μ (gjennomsnittet)?
Sammenlign to normalfordelinger: - Fordeling A: μ = 100, σ = 10 - Fordeling B: μ = 100, σ = 20
Lag tetthetsfunksjonen.
Beregn f(100) for begge fordelinger.
Hvilken fordeling er "høyere" og "smalere"? Hvorfor?
✓Normalfordelingen er klokkeformet og symmetrisk
✓Z-score: z = (x - μ) / σ måler avstand fra gjennomsnittet
✓68% av verdiene er innenfor ±1σ, 95% innenfor ±2σ
✓Tetthetsfunksjonen beskriver fordelingens form