MET2

Cheat Sheet

Formler, begreper og oppsummering

Statistikk for økonomer

eksamenssett.no

Symboloversikt

Populasjon (greske bokstaver)

• $\mu$ = populasjonsgjennomsnitt | $\sigma$ = populasjonsstandardavvik | $\sigma^2$ = populasjonsvarians
• $\beta_0, \beta_1$ = sanne regresjonskoeffisienter | $\rho$ = populasjonskorrelasjon | $\varepsilon$ = feilledd

Utvalg (latinske bokstaver)

• $\bar{x}$ = utvalgsgjennomsnitt | $s$ = utvalgsstandardavvik | $s^2$ = utvalgsvarians
• $\hat{\beta}_0, \hat{\beta}_1$ = estimerte regresjonskoeffisienter | $r$ = utvalgskorrelasjon | $e_i$ = residual

Statistisk inferens

• $n$ = utvalgsstørrelse | $\alpha$ = signifikansnivå | $H_0$ = nullhypotese | $H_1$ = alternativ hypotese
• $t$ = testobservator (t-test) | $z$ = testobservator (z-test) | $p$ -verdi = sannsynlighet for resultat minst like ekstremt
• $R^2$ = forklaringsgrad | $\bar{R}^2$ = justert $R^2$ | $F$ = F-testobservator

Formler

Deskriptiv statistikk

• $\displaystyle \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$ (gjennomsnitt)
• $\displaystyle s^2 = \frac{1}{n-1}\sum(x_i - \bar{x})^2$ (utvalgsvarians)
• $CV = s/\bar{x} \cdot 100\,\%$ (variasjonskoeffisient)
• $IQR = Q_3 - Q_1$ (kvartilbredde)

Sannsynlighetsregning

• $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
• $P(A|B) = P(A \cap B)/P(B)$
•Bayes: $\displaystyle P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum P(A|B_i)P(B_i)}$
•Uavhengighet: $P(A \cap B) = P(A) \cdot P(B)$

Sannsynlighetsfordelinger

•Binomisk: $P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}$ , $E = np$ , $\text{Var} = np(1-p)$
•Poisson: $P(X=k) = \lambda^k e^{-\lambda}/k!$ , $E = \text{Var} = \lambda$
•Normal: $Z = (X - \mu)/\sigma$
• $E(aX+b) = aE(X)+b$ , $\text{Var}(aX+b) = a^2\text{Var}(X)$

Estimering og konfidensintervall

• $SE(\bar{X}) = s/\sqrt{n}$ (standardfeil)
•z-intervall: $\bar{x} \pm z_{\alpha/2} \cdot \sigma/\sqrt{n}$
•t-intervall: $\bar{x} \pm t_{\alpha/2,n-1} \cdot s/\sqrt{n}$
•Proporsjon: $\hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}$
•Utvalgsstørrelse: $n = (z_{\alpha/2} \cdot \sigma / E)^2$

Hypotesetesting

•t-test: $t = (\bar{x} - \mu_0)/(s/\sqrt{n})$ , $df = n-1$
•z-test proporsjon: $z = (\hat{p}-p_0)/\sqrt{p_0(1-p_0)/n}$
•Forkast $H_0$ hvis $p$ -verdi $\le \alpha$
•Type I = $\alpha$ , type II = $\beta$ , styrke = $1-\beta$

Regresjon

• $\hat{\beta}_1 = S_{XY}/S_{XX}$ , $\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}$
• $R^2 = 1 - SSE/SST = SSR/SST$
• $\bar{R}^2 = 1 - (1-R^2)(n-1)/(n-k-1)$
•F-test: $F = MSR/MSE$ , $df_1 = k$ , $df_2 = n-k-1$
•t-test: $t = \hat{\beta}_j/SE(\hat{\beta}_j)$
• $s_e = \sqrt{SSE/(n-k-1)}$

Modelldiagnostikk

•Durbin-Watson: $DW \approx 2$ = ingen autokorrelasjon
•VIF $_j = 1/(1-R_j^2)$ , VIF $> 10$ = problem
•Cooks avstand: $D_i > 1$ = innflytelsesrik
•AIC/BIC: lavere = bedre modell

Nøkkelformler per tema

Deskriptiv statistikk

• $\displaystyle \bar{x} = \frac{1}{n}\sum x_i$
• $\displaystyle s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2$
• $\displaystyle CV = \frac{s}{\bar{x}} \cdot 100\,\%$
• $IQR = Q_3 - Q_1$

Sannsynlighetsregning

• $\displaystyle P(A|B) = \frac{P(A \cap B)}{P(B)}$
• $P(A \cap B) = P(A) \cdot P(B)$ (uavhengige)
•Bayes: $\displaystyle P(B_j|A) = \frac{P(A|B_j) P(B_j)}{\sum P(A|B_i) P(B_i)}$

Sannsynlighetsfordelinger

•Binomisk: $P(X=k) = \binom{n}{k} p^k(1-p)^{n-k}$ , $E(X) = np$
•Poisson: $\displaystyle P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$ , $E(X) = \text{Var}(X) = \lambda$
•Normal: $\displaystyle Z = \frac{X-\mu}{\sigma}$ , 68-95-99,7-regel

Estimering og konfidensintervall

• $\displaystyle SE(\bar{X}) = \frac{s}{\sqrt{n}}$
•z-intervall: $\displaystyle \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$
•t-intervall: $\displaystyle \bar{x} \pm t_{\alpha/2,\,n-1} \cdot \frac{s}{\sqrt{n}}$
•Proporsjon: $\displaystyle \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$

Hypotesetesting

•t-test: $\displaystyle t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$ , $df = n-1$
•z-test proporsjon: $\displaystyle z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}$
•Type I feil = $\alpha$ , type II feil = $\beta$ , styrke = $1-\beta$

Enkel lineær regresjon

• $\displaystyle \hat{\beta}_1 = \frac{S_{XY}}{S_{XX}}$ , $\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}$
• $\displaystyle R^2 = 1 - \frac{SSE}{SST}$
•t-test: $\displaystyle t = \frac{\hat{\beta}_1}{SE(\hat{\beta}_1)}$ , $df = n-2$
• $s_e = \sqrt{SSE/(n-2)}$

Multippel regresjon

• $\displaystyle \bar{R}^2 = 1 - (1-R^2)\frac{n-1}{n-k-1}$
•F-test: $\displaystyle F = \frac{MSR}{MSE}$ , $df_1 = k$ , $df_2 = n-k-1$
•t-test: $\displaystyle t = \frac{\hat{\beta}_j}{SE(\hat{\beta}_j)}$ , $df = n-k-1$
•VIF $\displaystyle _j = \frac{1}{1 - R_j^2}$

Modelldiagnostikk

•Durbin-Watson: $\displaystyle DW = \frac{\sum(e_i - e_{i-1})^2}{\sum e_i^2}$ , ideelt $\approx 2$
•VIF $> 10$ = alvorlig multikollinearitet
•Modellvalg: $\bar{R}^2$ (maks), AIC/BIC (min)

Vanlige feil å unngå

Deskriptiv statistikk

•Deler på $n$ i stedet for $n-1$ i utvalgsvariansen — husk at Bessel-korreksjonen ( $n-1$ ) gir forventningsrett estimat.
•Forveksler standardavvik og varians — standardavviket er i samme enhet som dataene, variansen er i kvadrerte enheter.
•Bruker gjennomsnitt som sentralmål for skjeve fordelinger — medianen er mer robust ved skjevhet og ekstremverdier.
•Glemmer at variasjonskoeffisienten kun gir mening for data med naturlig nullpunkt (forholdstallsskala).

Sannsynlighetsregning

•Glemmer å trekke fra snittet i addisjonsloven — $P(A \cup B) \neq P(A) + P(B)$ med mindre hendelsene er gjensidig utelukkende.
•Forveksler uavhengighet og gjensidig utelukkende — gjensidig utelukkende hendelser er IKKE uavhengige (tvert imot).
•Forveksler $P(A|B)$ og $P(B|A)$ — dette er generelt svært forskjellige sannsynligheter.
•Bruker feil nevner i Bayes — husk at nevneren er totalsannsynligheten $P(A)$ beregnet med totallovsetningen.

Sannsynlighetsfordelinger

•Forveksler $\sigma^2$ (varians) og $\sigma$ (standardavvik) i normalfordelingen — $N(\mu, \sigma^2)$ bruker variansen som parameter.
•Glemmer å standardisere til $Z$ før bruk av normaltabellen.
•Bruker binomisk fordeling når forsøkene ikke er uavhengige (f.eks. trekking uten tilbakelegging med liten populasjon).
•Glemmer $\text{Var}(aX) = a^2\text{Var}(X)$ — det er $a^2$ , ikke $a$ .

Estimering og konfidensintervall

•Bruker z-verdier når $\sigma$ er ukjent — bruk t-fordeling med $n-1$ frihetsgrader.
•Tolker 95 % KI feil: det betyr IKKE at det er 95 % sannsynlighet for at $\mu$ ligger i intervallet. Det betyr at 95 % av slike intervaller vil dekke $\mu$ .
•Glemmer at dobling av presisjon krever fire ganger så stort utvalg ( $n$ er omvendt proporsjonal med $E^2$ ).
•Bruker feil formel for proporsjon vs. gjennomsnitt.

Hypotesetesting

•Bruker $\hat{p}$ i stedet for $p_0$ i nevneren ved z-test for proporsjon — under $H_0$ bruker vi alltid $p_0$ .
•Sier at vi «aksepterer» $H_0$ — korrekt formulering er «kan ikke forkaste $H_0$ » eller «det er ikke tilstrekkelig bevis».
•Glemmer å doble p-verdien ved tosidig test — p-verdien fra tabellen for én hale må ganges med 2.
•Forveksler statistisk signifikans med praktisk betydning — en stor $n$ kan gi signifikant resultat selv for minimale forskjeller.

Enkel lineær regresjon

•Tolker $\hat{\beta}_0$ kausalt uten å vurdere om $X = 0$ er meningsfullt i konteksten.
•Forveksler $R^2$ og korrelasjon — i enkel regresjon er $R^2 = r^2$ , men dette gjelder ikke i multippel regresjon.
•Bruker feil frihetsgrader ( $n-1$ i stedet for $n-2$ ) — enkel regresjon estimerer to parametere, derav $n-2$ .
•Ekstrapolerer langt utenfor dataområdet — regresjonsmodellen er kun pålitelig innenfor observerte $X$ -verdier.

Multippel regresjon

•Tolker $\hat{\beta}_j$ uten «kontrollert for»-presiseringen — i multippel regresjon er koeffisienten en partiell effekt.
•Bruker $R^2$ i stedet for $\bar{R}^2$ til modellsammenligning — $R^2$ øker alltid med flere variabler, $\bar{R}^2$ kan synke.
•Inkluderer alle $m$ dummyer for en kategorisk variabel med $m$ kategorier — det gir perfekt multikollinearitet (dummy-fellen).
•Forveksler individuell t-test og samlet F-test — F-test kan forkaste mens alle t-tester beholder $H_0$ (multikollinearitet).

Modelldiagnostikk

•Ignorerer residualanalyse — en modell med høy $R^2$ kan likevel bryte viktige forutsetninger.
•Forveksler heteroskedastisitet og autokorrelasjon — heteroskedastisitet er ikke-konstant varians, autokorrelasjon er korrelasjon mellom feilledd.
•Tror at brudd på forutsetningene gjør OLS-estimatene forventningsskjeve — de er fortsatt forventningsrette, men standardfeilene blir feil.
•Fjerner uteliggere automatisk uten faglig begrunnelse — alltid vurder om det er en logisk grunn til å fjerne.

Eksamenstips

Deskriptiv statistikk

•Skriv alltid ned formelen du bruker FØR du setter inn tall — det gir poeng selv om svaret blir feil.
•Vis mellomregning i variansberegninger: skriv ut alle $(x_i - \bar{x})^2$ -leddene.
•Vurder alltid om medianen er bedre enn gjennomsnittet som sentralmål — kommenter skjevhet og ekstremverdier.

Sannsynlighetsregning

•Tegn alltid et Venn-diagram eller trediagram for å visualisere problemet.
•Definer hendelsene tydelig med bokstaver og skriv ned de oppgitte sannsynlighetene FØR du regner.
•I Bayes-oppgaver: identifiser alltid hva som er «gitt» (betingelsen) og hva du skal finne.

Sannsynlighetsfordelinger

•Identifiser alltid fordelingstype først: er variabelen diskret eller kontinuerlig? Er det telling (binomisk/Poisson) eller måling (normal)?
•Skriv alltid $X \sim \text{Fordeling}(\text{parametere})$ før du begynner å regne.
•For normalfordelingen: tegn en skisse med det skraverte arealet du skal finne — det forhindrer fortegnsfeil.

Estimering og konfidensintervall

•Sjekk alltid forutsetningene: er $\sigma$ kjent/ukjent? Er $n$ stor nok for SGT? Er fordelingen normalfordelt?
•Vis tydelig hvilken tabell og kritisk verdi du bruker (z vs. t) og oppgi frihetsgrader for t.
•Avrund feilmarginen til passende antall desimaler, og presenter KI tydelig som et intervall $(a;\; b)$ .

Hypotesetesting

•Følg ALLTID de fem stegene eksplisitt — sensor gir poeng for hvert steg.
•Skriv en konklusjon i kontekst, ikke bare «forkast $H_0$ » — forklar hva det betyr i oppgavens sammenheng.
•Oppgi alltid frihetsgrader og den kritiske verdien/p-verdien du bruker.

Enkel lineær regresjon

•Tolk ALLTID koeffisientene i kontekst: «Når $X$ øker med 1 enhet, endres $Y$ med $\hat{\beta}_1$ enheter.»
•Kommenter $R^2$ — er forklaringsgraden god nok? Hva forklarer de resterende prosentene?
•Husk at signifikant $\beta_1 \neq 0$ ikke nødvendigvis betyr kausal sammenheng — korrelasjon er ikke kausalitet.

Multippel regresjon

•Tolk alltid koeffisienter med «kontrollert for de andre variablene» — dette er hele poenget med multippel regresjon.
•Ved modellsammenligning: bruk $\bar{R}^2$ (justert) og F-test, ikke bare $R^2$ .
•Kommenter eventuelle VIF-verdier og multikollinearitetsproblemer dersom informasjon er gitt.

Modelldiagnostikk

•Beskriv systematisk hva du ser i residualplottet: form, spredning, eventuelle mønstre.
•Kommenter Durbin-Watson-verdien i kontekst: « $DW = 1{,}5$ , noe som kan indikere positiv autokorrelasjon.»
•Foreslå konkrete tiltak ved brudd: White-robuste standardfeil ved heteroskedastisitet, logtransformasjon, eller inkludering av utelatte variabler.

MET2

Cheat Sheet

Formler, begreper og oppsummering

Statistikk for økonomer

eksamenssett.no

Symboloversikt

Populasjon (greske bokstaver)

• $\mu$ = populasjonsgjennomsnitt | $\sigma$ = populasjonsstandardavvik | $\sigma^2$ = populasjonsvarians
• $\beta_0, \beta_1$ = sanne regresjonskoeffisienter | $\rho$ = populasjonskorrelasjon | $\varepsilon$ = feilledd

Utvalg (latinske bokstaver)

• $\bar{x}$ = utvalgsgjennomsnitt | $s$ = utvalgsstandardavvik | $s^2$ = utvalgsvarians
• $\hat{\beta}_0, \hat{\beta}_1$ = estimerte regresjonskoeffisienter | $r$ = utvalgskorrelasjon | $e_i$ = residual

Statistisk inferens

• $n$ = utvalgsstørrelse | $\alpha$ = signifikansnivå | $H_0$ = nullhypotese | $H_1$ = alternativ hypotese
• $t$ = testobservator (t-test) | $z$ = testobservator (z-test) | $p$ -verdi = sannsynlighet for resultat minst like ekstremt
• $R^2$ = forklaringsgrad | $\bar{R}^2$ = justert $R^2$ | $F$ = F-testobservator

Formler

Deskriptiv statistikk

• $\displaystyle \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$ (gjennomsnitt)
• $\displaystyle s^2 = \frac{1}{n-1}\sum(x_i - \bar{x})^2$ (utvalgsvarians)
• $CV = s/\bar{x} \cdot 100\,\%$ (variasjonskoeffisient)
• $IQR = Q_3 - Q_1$ (kvartilbredde)

Sannsynlighetsregning

• $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
• $P(A|B) = P(A \cap B)/P(B)$
•Bayes: $\displaystyle P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum P(A|B_i)P(B_i)}$
•Uavhengighet: $P(A \cap B) = P(A) \cdot P(B)$

Sannsynlighetsfordelinger

•Binomisk: $P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}$ , $E = np$ , $\text{Var} = np(1-p)$
•Poisson: $P(X=k) = \lambda^k e^{-\lambda}/k!$ , $E = \text{Var} = \lambda$
•Normal: $Z = (X - \mu)/\sigma$
• $E(aX+b) = aE(X)+b$ , $\text{Var}(aX+b) = a^2\text{Var}(X)$

Estimering og konfidensintervall

• $SE(\bar{X}) = s/\sqrt{n}$ (standardfeil)
•z-intervall: $\bar{x} \pm z_{\alpha/2} \cdot \sigma/\sqrt{n}$
•t-intervall: $\bar{x} \pm t_{\alpha/2,n-1} \cdot s/\sqrt{n}$
•Proporsjon: $\hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}$
•Utvalgsstørrelse: $n = (z_{\alpha/2} \cdot \sigma / E)^2$

Hypotesetesting

•t-test: $t = (\bar{x} - \mu_0)/(s/\sqrt{n})$ , $df = n-1$
•z-test proporsjon: $z = (\hat{p}-p_0)/\sqrt{p_0(1-p_0)/n}$
•Forkast $H_0$ hvis $p$ -verdi $\le \alpha$
•Type I = $\alpha$ , type II = $\beta$ , styrke = $1-\beta$

Regresjon

• $\hat{\beta}_1 = S_{XY}/S_{XX}$ , $\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}$
• $R^2 = 1 - SSE/SST = SSR/SST$
• $\bar{R}^2 = 1 - (1-R^2)(n-1)/(n-k-1)$
•F-test: $F = MSR/MSE$ , $df_1 = k$ , $df_2 = n-k-1$
•t-test: $t = \hat{\beta}_j/SE(\hat{\beta}_j)$
• $s_e = \sqrt{SSE/(n-k-1)}$

Modelldiagnostikk

•Durbin-Watson: $DW \approx 2$ = ingen autokorrelasjon
•VIF $_j = 1/(1-R_j^2)$ , VIF $> 10$ = problem
•Cooks avstand: $D_i > 1$ = innflytelsesrik
•AIC/BIC: lavere = bedre modell

Nøkkelformler per tema

Deskriptiv statistikk

• $\displaystyle \bar{x} = \frac{1}{n}\sum x_i$
• $\displaystyle s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2$
• $\displaystyle CV = \frac{s}{\bar{x}} \cdot 100\,\%$
• $IQR = Q_3 - Q_1$

Sannsynlighetsregning

• $\displaystyle P(A|B) = \frac{P(A \cap B)}{P(B)}$
• $P(A \cap B) = P(A) \cdot P(B)$ (uavhengige)
•Bayes: $\displaystyle P(B_j|A) = \frac{P(A|B_j) P(B_j)}{\sum P(A|B_i) P(B_i)}$

Sannsynlighetsfordelinger

•Binomisk: $P(X=k) = \binom{n}{k} p^k(1-p)^{n-k}$ , $E(X) = np$
•Poisson: $\displaystyle P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$ , $E(X) = \text{Var}(X) = \lambda$
•Normal: $\displaystyle Z = \frac{X-\mu}{\sigma}$ , 68-95-99,7-regel

Estimering og konfidensintervall

• $\displaystyle SE(\bar{X}) = \frac{s}{\sqrt{n}}$
•z-intervall: $\displaystyle \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$
•t-intervall: $\displaystyle \bar{x} \pm t_{\alpha/2,\,n-1} \cdot \frac{s}{\sqrt{n}}$
•Proporsjon: $\displaystyle \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$

Hypotesetesting

•t-test: $\displaystyle t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$ , $df = n-1$
•z-test proporsjon: $\displaystyle z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}$
•Type I feil = $\alpha$ , type II feil = $\beta$ , styrke = $1-\beta$

Enkel lineær regresjon

• $\displaystyle \hat{\beta}_1 = \frac{S_{XY}}{S_{XX}}$ , $\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}$
• $\displaystyle R^2 = 1 - \frac{SSE}{SST}$
•t-test: $\displaystyle t = \frac{\hat{\beta}_1}{SE(\hat{\beta}_1)}$ , $df = n-2$
• $s_e = \sqrt{SSE/(n-2)}$

Multippel regresjon

• $\displaystyle \bar{R}^2 = 1 - (1-R^2)\frac{n-1}{n-k-1}$
•F-test: $\displaystyle F = \frac{MSR}{MSE}$ , $df_1 = k$ , $df_2 = n-k-1$
•t-test: $\displaystyle t = \frac{\hat{\beta}_j}{SE(\hat{\beta}_j)}$ , $df = n-k-1$
•VIF $\displaystyle _j = \frac{1}{1 - R_j^2}$

Modelldiagnostikk

•Durbin-Watson: $\displaystyle DW = \frac{\sum(e_i - e_{i-1})^2}{\sum e_i^2}$ , ideelt $\approx 2$
•VIF $> 10$ = alvorlig multikollinearitet
•Modellvalg: $\bar{R}^2$ (maks), AIC/BIC (min)

Vanlige feil å unngå

Deskriptiv statistikk

•Deler på $n$ i stedet for $n-1$ i utvalgsvariansen — husk at Bessel-korreksjonen ( $n-1$ ) gir forventningsrett estimat.
•Forveksler standardavvik og varians — standardavviket er i samme enhet som dataene, variansen er i kvadrerte enheter.
•Bruker gjennomsnitt som sentralmål for skjeve fordelinger — medianen er mer robust ved skjevhet og ekstremverdier.
•Glemmer at variasjonskoeffisienten kun gir mening for data med naturlig nullpunkt (forholdstallsskala).

Sannsynlighetsregning

•Glemmer å trekke fra snittet i addisjonsloven — $P(A \cup B) \neq P(A) + P(B)$ med mindre hendelsene er gjensidig utelukkende.
•Forveksler uavhengighet og gjensidig utelukkende — gjensidig utelukkende hendelser er IKKE uavhengige (tvert imot).
•Forveksler $P(A|B)$ og $P(B|A)$ — dette er generelt svært forskjellige sannsynligheter.
•Bruker feil nevner i Bayes — husk at nevneren er totalsannsynligheten $P(A)$ beregnet med totallovsetningen.

Sannsynlighetsfordelinger

•Forveksler $\sigma^2$ (varians) og $\sigma$ (standardavvik) i normalfordelingen — $N(\mu, \sigma^2)$ bruker variansen som parameter.
•Glemmer å standardisere til $Z$ før bruk av normaltabellen.
•Bruker binomisk fordeling når forsøkene ikke er uavhengige (f.eks. trekking uten tilbakelegging med liten populasjon).
•Glemmer $\text{Var}(aX) = a^2\text{Var}(X)$ — det er $a^2$ , ikke $a$ .

Estimering og konfidensintervall

•Bruker z-verdier når $\sigma$ er ukjent — bruk t-fordeling med $n-1$ frihetsgrader.
•Tolker 95 % KI feil: det betyr IKKE at det er 95 % sannsynlighet for at $\mu$ ligger i intervallet. Det betyr at 95 % av slike intervaller vil dekke $\mu$ .
•Glemmer at dobling av presisjon krever fire ganger så stort utvalg ( $n$ er omvendt proporsjonal med $E^2$ ).
•Bruker feil formel for proporsjon vs. gjennomsnitt.

Hypotesetesting

•Bruker $\hat{p}$ i stedet for $p_0$ i nevneren ved z-test for proporsjon — under $H_0$ bruker vi alltid $p_0$ .
•Sier at vi «aksepterer» $H_0$ — korrekt formulering er «kan ikke forkaste $H_0$ » eller «det er ikke tilstrekkelig bevis».
•Glemmer å doble p-verdien ved tosidig test — p-verdien fra tabellen for én hale må ganges med 2.
•Forveksler statistisk signifikans med praktisk betydning — en stor $n$ kan gi signifikant resultat selv for minimale forskjeller.

Enkel lineær regresjon

•Tolker $\hat{\beta}_0$ kausalt uten å vurdere om $X = 0$ er meningsfullt i konteksten.
•Forveksler $R^2$ og korrelasjon — i enkel regresjon er $R^2 = r^2$ , men dette gjelder ikke i multippel regresjon.
•Bruker feil frihetsgrader ( $n-1$ i stedet for $n-2$ ) — enkel regresjon estimerer to parametere, derav $n-2$ .
•Ekstrapolerer langt utenfor dataområdet — regresjonsmodellen er kun pålitelig innenfor observerte $X$ -verdier.

Multippel regresjon

•Tolker $\hat{\beta}_j$ uten «kontrollert for»-presiseringen — i multippel regresjon er koeffisienten en partiell effekt.
•Bruker $R^2$ i stedet for $\bar{R}^2$ til modellsammenligning — $R^2$ øker alltid med flere variabler, $\bar{R}^2$ kan synke.
•Inkluderer alle $m$ dummyer for en kategorisk variabel med $m$ kategorier — det gir perfekt multikollinearitet (dummy-fellen).
•Forveksler individuell t-test og samlet F-test — F-test kan forkaste mens alle t-tester beholder $H_0$ (multikollinearitet).

Modelldiagnostikk

•Ignorerer residualanalyse — en modell med høy $R^2$ kan likevel bryte viktige forutsetninger.
•Forveksler heteroskedastisitet og autokorrelasjon — heteroskedastisitet er ikke-konstant varians, autokorrelasjon er korrelasjon mellom feilledd.
•Tror at brudd på forutsetningene gjør OLS-estimatene forventningsskjeve — de er fortsatt forventningsrette, men standardfeilene blir feil.
•Fjerner uteliggere automatisk uten faglig begrunnelse — alltid vurder om det er en logisk grunn til å fjerne.

Eksamenstips

Deskriptiv statistikk

•Skriv alltid ned formelen du bruker FØR du setter inn tall — det gir poeng selv om svaret blir feil.
•Vis mellomregning i variansberegninger: skriv ut alle $(x_i - \bar{x})^2$ -leddene.
•Vurder alltid om medianen er bedre enn gjennomsnittet som sentralmål — kommenter skjevhet og ekstremverdier.

Sannsynlighetsregning

•Tegn alltid et Venn-diagram eller trediagram for å visualisere problemet.
•Definer hendelsene tydelig med bokstaver og skriv ned de oppgitte sannsynlighetene FØR du regner.
•I Bayes-oppgaver: identifiser alltid hva som er «gitt» (betingelsen) og hva du skal finne.

Sannsynlighetsfordelinger

•Identifiser alltid fordelingstype først: er variabelen diskret eller kontinuerlig? Er det telling (binomisk/Poisson) eller måling (normal)?
•Skriv alltid $X \sim \text{Fordeling}(\text{parametere})$ før du begynner å regne.
•For normalfordelingen: tegn en skisse med det skraverte arealet du skal finne — det forhindrer fortegnsfeil.

Estimering og konfidensintervall

•Sjekk alltid forutsetningene: er $\sigma$ kjent/ukjent? Er $n$ stor nok for SGT? Er fordelingen normalfordelt?
•Vis tydelig hvilken tabell og kritisk verdi du bruker (z vs. t) og oppgi frihetsgrader for t.
•Avrund feilmarginen til passende antall desimaler, og presenter KI tydelig som et intervall $(a;\; b)$ .

Hypotesetesting

•Følg ALLTID de fem stegene eksplisitt — sensor gir poeng for hvert steg.
•Skriv en konklusjon i kontekst, ikke bare «forkast $H_0$ » — forklar hva det betyr i oppgavens sammenheng.
•Oppgi alltid frihetsgrader og den kritiske verdien/p-verdien du bruker.

Enkel lineær regresjon

•Tolk ALLTID koeffisientene i kontekst: «Når $X$ øker med 1 enhet, endres $Y$ med $\hat{\beta}_1$ enheter.»
•Kommenter $R^2$ — er forklaringsgraden god nok? Hva forklarer de resterende prosentene?
•Husk at signifikant $\beta_1 \neq 0$ ikke nødvendigvis betyr kausal sammenheng — korrelasjon er ikke kausalitet.

Multippel regresjon

•Tolk alltid koeffisienter med «kontrollert for de andre variablene» — dette er hele poenget med multippel regresjon.
•Ved modellsammenligning: bruk $\bar{R}^2$ (justert) og F-test, ikke bare $R^2$ .
•Kommenter eventuelle VIF-verdier og multikollinearitetsproblemer dersom informasjon er gitt.

Modelldiagnostikk

•Beskriv systematisk hva du ser i residualplottet: form, spredning, eventuelle mønstre.
•Kommenter Durbin-Watson-verdien i kontekst: « $DW = 1{,}5$ , noe som kan indikere positiv autokorrelasjon.»
•Foreslå konkrete tiltak ved brudd: White-robuste standardfeil ved heteroskedastisitet, logtransformasjon, eller inkludering av utelatte variabler.