Regresjon handler om å finne en matematisk modell som passer til et datasett. Korrelasjon måler hvor sterk sammenhengen er mellom to variable. Dette er viktige verktøy i samfunnsfaglig analyse.
En regresjonslinje er en rett linje som best mulig beskriver sammenhengen mellom to variable. Den brukes til å predikere verdier og analysere trender.
hvor a er stigningstallet og b er konstantleddet
Regresjonslinjen plasseres slik at summen av kvadrerte avvik mellom datapunktene og linjen blir minst mulig.
I GeoGebra:
RegLin(punktliste)Finner regresjonslinjen automatisk
Tegn punkter og finn regresjonslinjen.
Korrelasjonskoeffisienten r måler styrken og retningen på den lineære sammenhengen mellom to variable.
r = 1: Perfekt positiv lineær sammenheng
r = -1: Perfekt negativ lineær sammenheng
r = 0: Ingen lineær sammenheng
|r| > 0.7
0.3 < |r| < 0.7
|r| < 0.3
I GeoGebra:
Korrelasjon(data)Viktig:
Korrelasjon betyr ikke nødvendigvis kausalitet! To variable kan korrelere uten at den ene forårsaker den andre.
Finn korrelasjonskoeffisienten for et datasett.
Når du har funnet en regresjonsmodell, er det viktig å kunne tolke den og vurdere hvor godt den passer til dataene.
For y = ax + b:
Bruk modellen til å predikere y-verdier for nye x-verdier.
Interpolasjon: Predikere innenfor dataområdet
Ekstrapolasjon: Predikere utenfor dataområdet (mer usikkert!)
Data viser befolkning (i millioner) som funksjon av år:
Tolking: Befolkningen øker med 0.05 millioner (50 000) per år. I år 2000: y = 0.05(2000) - 95.2 = 4.8 millioner.
Finn modell og bruk den til prediksjon.
Løs oppgavene over.
| Kommando | Beskrivelse | Eksempel |
|---|---|---|
RegLin(punktliste) | Finner regresjonslinjen | RegLin({(1,2), (2,4), (3,6)}) |
Korrelasjon(data) | Beregner korrelasjonskoeffisienten r | Korrelasjon(data) |
modell(x) | Bruker modellen til prediksjon | modell(10) |