ECON3150

Cheat Sheet

Formler, begreper og oppsummering

Introductory Econometrics

eksamenssett.no

Nøkkelformler per tema

OLS-estimering og tolkning

• $\hat{\beta}_1 = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sum_{i=1}^n (X_i - \bar{X})^2}$ (OLS-estimator)
• $R^2 = 1 - \frac{SSR}{SST} = \text{Cor}(\hat{Y}_i, Y_i)^2$
• $\text{RMSE} = \sqrt{\frac{SSR}{n-k-1}}, \quad R^2 = 1 - \frac{\text{RMSE}^2 \cdot (n-k-1)}{(n-1) \cdot SD(Y)^2}$
•Log-level: $\%\Delta Y \approx 100 \beta_1 \cdot \Delta X$ (tilnærming for liten $\beta_1$ )
•Log-log (elastisitet): $\%\Delta Y \approx \beta_1 \cdot \%\Delta X$

Hypotesetesting og konfidensintervaller

• $t = \frac{\hat{\beta}_j - \beta_{j,0}}{SE(\hat{\beta}_j)}$ (t-statistikk)
• $KI_{1-\alpha} = \hat{\beta}_j \pm z_{\alpha/2} \cdot SE(\hat{\beta}_j)$
•Kritiske verdier: $z_{0.10} = 1.28$ , $z_{0.05} = 1.64$ , $z_{0.025} = 1.96$ , $z_{0.005} = 2.58$
•P-verdi (tosidig): $p = 2 \cdot \Phi(-|t|) = 2 \cdot (1 - \Phi(|t|))$
•68%-KI: $\hat{\beta}_j \pm 1.00 \cdot SE$ (bredde = $\pm 1$ standardfeil)

Multippel regresjon og modellvalg

• $F = \frac{(SSR_r - SSR_{ur})/q}{SSR_{ur}/(n-k-1)}$ (F-test med SSR, krever homoskedastisitet)
• $F = \frac{(R^2_{ur} - R^2_r)/q}{(1-R^2_{ur})/(n-k_{ur}-1)}$ (F-test med $R^2$ )
• $\bar{R}^2 = 1 - \frac{(1-R^2)(n-1)}{n-k-1}$ (Justert R²)
•RMSE²·(n-k-1) = SSR (nyttig når eksamen gir RMSE)
•Skalering av Y: alle $\hat{\beta}_j$ og SE multipliseres med skaleringsfaktoren; $R^2$ er uendret

Utelatt variabel-bias og OVB-formelen

• $\tilde{\beta}_1 = \hat{\beta}_1 + \hat{\beta}_2 \cdot \tilde{\delta}_1$ (OVB: kort = lang + bias)
•Bias = $\hat{\beta}_2 \cdot \tilde{\delta}_1$ = (effekt av utelatt variabel på Y) × (korrelasjon med X)
• $\tilde{\delta}_1 = \frac{\tilde{\beta}_1 - \hat{\beta}_1}{\hat{\beta}_2}$ (utled delta fra to regresjoner)
• $r_{XW} = \tilde{\delta}_1 \cdot \frac{SD(X)}{SD(W)}$ (korrelasjon fra OVB)

Ikke-lineære spesifikasjoner

•Kvadratisk: $Y_i = \beta_0 + \beta_1 X_i + \beta_2 X_i^2 + u_i$ , marginal effekt $= \beta_1 + 2\beta_2 X$
•Knekkpunkt: $X^* = -\beta_1/(2\beta_2)$ (maksimum/minimum for kvadratisk modell)
•Interaksjon: $Y_i = \beta_0 + \beta_1 X_i + \beta_2 D_i + \beta_3 (X_i \cdot D_i) + u_i$
•R: feols(y ~ x + I(x^2), data) for kvadratisk; feols(y ~ x*d, data) for interaksjon
•Gjennomsnittlig marginal effekt av alder: $\hat{\beta}_1 + 2\hat{\beta}_2 \bar{X}$

Heteroskedastisitet og robuste standardfeil

•IID: $\displaystyle SE(\hat{\beta}_1) = \sqrt{\hat{\sigma}^2 / \sum(X_i - \bar{X})^2}$ , $\hat{\sigma}^2 = SSR/(n-k-1)$
•HC-robust SE bruker $\hat{\Omega} = \text{diag}(\hat{u}_1^2, \ldots, \hat{u}_n^2)$
•Gauss-Markov: OLS er BLUE under homoskedastisitet, normalitet ikke nødvendig
•SSR = RMSE² × (n − k − 1) (nyttig for F-test fra output)

Instrumentvariabler og Wald-estimatoren

• $\hat{\beta}_{\text{Wald}} = \frac{\bar{Y}_{Z=1} - \bar{Y}_{Z=0}}{\bar{X}_{Z=1} - \bar{X}_{Z=0}} = \frac{\text{Reduced form}}{\text{First stage}}$
•Relevanskrav: $\text{Cov}(Z_i, X_i) \neq 0$ , test: $F_{\text{first stage}} > 10$
•Eksklusjonsrestriksjon: $\text{Cov}(Z_i, u_i) = 0$ (ikke testbar empirisk)
•R: feols(Y ~ W | X ~ Z, data) (2SLS i fixest)
•LATE = effekten for compliers (de som endrer $X$ pga. $Z$ )

Probit og logit-modeller

•Probit: $P(Y=1|X) = \Phi(\beta_0 + \beta_1 X)$
•Logit: $P(Y=1|X) = \Lambda(\beta_0 + \beta_1 X) = e^{\beta_0 + \beta_1 X}/(1+e^{\beta_0 + \beta_1 X})$
•Marginal effekt (probit): $\phi(z) \cdot \hat{\beta}_1$ der $z = \hat{\beta}_0 + \hat{\beta}_1 X$ og $\phi = \Phi'$
•LPM: $P(Y=1|X) = \beta_0 + \beta_1 X$ (OLS på binær variabel)

Paneldata og fixed effects

•FE-modell: $Y_{it} = \beta_0 + \beta_1 X_{it} + \eta_i + \varepsilon_{it}$
•Within-transformasjon: $\tilde{Y}_{it} = Y_{it} - \bar{Y}_{i}$ , $\tilde{X}_{it} = X_{it} - \bar{X}_{i}$
•Toveis FE: $Y_{it} = \beta_1 X_{it} + \eta_i + \lambda_t + \varepsilon_{it}$
•R: feols(Y ~ X | id, data) (entity FE); feols(Y ~ X | id + year, data) (toveis FE)

Difference-in-differences

• $\hat{\delta}_{\text{DiD}} = (\bar{Y}_{11} - \bar{Y}_{10}) - (\bar{Y}_{01} - \bar{Y}_{00})$
•DiD-regresjon: $Y_{it} = \beta_0 + \beta_1 D_i + \beta_2 T_t + \delta (D_i \cdot T_t) + u_{it}$
• $\delta$ er den kausale effekten under parallelltrendforutsetningen
•R: feols(Y ~ D + T + D:T, data)

Regresjonsdiskontinuitet (RD)

•Skarp RD: $Y_i = \beta_0 + \beta_1 \mathbf{1}(r_i \geq c) + \beta_2(r_i - c) + u_i$
•Fuzzy RD første trinn: $D_i = \pi_0 + \pi_1 \mathbf{1}(r_i \geq c) + \pi_2(r_i - c) + v_i$
•Fuzzy RD andre trinn: $Y_i = \beta_0 + \beta_1 D_i + \beta_2(r_i - c) + u_i$ ( $\beta_1$ = LATE ved terskelen)
•R (fuzzy): feols(Y ~ I(run - c) | D ~ I(run >= c), data)
•Kontinuitetsantakelse: potensielle utfall er kontinuerlige i $r$ ved $c$

Kausal inferens og indre gyldighet

• $E[u_i | X_i] = 0$ (betinget gjennomsnittsuavhengighet — betingelse for kausal OLS)
•CIA: $E[u_i | X_i, W_i] = 0$ (selection on observables)
•ITT: sammenlign tildelte grupper uansett etterlevelse
•LATE = $\hat{\beta}_{\text{Wald}}$ = ITT-effekt / First stage-effekt

Statistisk presisjon og store utvalg

• $SE(\hat{\beta}_1) = \frac{\hat{\sigma}}{\sqrt{n} \cdot SD(X)}$ — omvendt prop. med $\sqrt{n}$
• $\frac{\hat{\beta}_j - \beta_j}{SE(\hat{\beta}_j)} \xrightarrow{d} N(0,1)$ (CLT for OLS)
•Forventningsrett: $E[\hat{\beta}] = \beta$ (for alle $n$ ). Konsistent: $\hat{\beta} \xrightarrow{p} \beta$ ( $n \to \infty$ )
•KI-bredde halveres når $n$ firedobles (prop. med $1/\sqrt{n}$ )

Vanlige feil å unngå

OLS-estimering og tolkning

•Forveksle prosentpoeng og prosent. Når avhengig variabel er en sannsynlighet (0–1), er koeffisienten i prosentpoeng, IKKE prosent.
•Glemme å nevne referansegruppen når du tolker dummyvariabler. Koeffisienten er alltid RELATIVT til den utelatte kategorien.
•Tolke log-level-koeffisienter feil: $\beta_1 = 0.05$ betyr ca. 5% økning, IKKE 0.05% økning.
•Beregne R² feil fra RMSE: husk å justere for frihetsgrader med $(n-k-1)$ og $(n-1)$ .

Hypotesetesting og konfidensintervaller

•Bruke feil kritisk verdi for ensidig vs. tosidig test. For ensidig test: $z_{0.10} = 1.28$ (ikke 1.64).
•Lese feil av $\Phi$ -tabellen. Husk: tabellen gir $P(Z \leq z)$ . For $z_{0.025}$ : finn $z$ der $\Phi(z) = 0.975$ , ikke $0.025$ .
•Forveksle signifikansnivå og konfidensnivå. 5% signifikansnivå = 95% konfidensnivå.
•Oppgi p-verdi for tosidig test som ensidig. Les alltid oppgaveteksten: «two-sided» er standard.

Multippel regresjon og modellvalg

•Bruke feil frihetsgrader i F-testen. $q$ er antall restriksjoner (koeffisienter satt til null), IKKE antall variabler i modellen.
•Konkludere med at en modell er «bedre» bare fordi $R^2$ er høyere. Høyere $R^2$ kan skyldes at vi la til irrelevante variabler.
•Glemme å justere for frihetsgrader når du beregner $R^2$ fra RMSE: husk faktoren $(n-k-1)$ .
•Tolke multippel regresjonskoeffisient som enkel regresjon. I multippel regresjon er $\hat{\beta}_1$ ceteris paribus — det er ikke det samme som i enkel regresjon.

Utelatt variabel-bias og OVB-formelen

•Blande «kort» og «lang» regresjon. Den KORTE mangler variabelen, den LANGE inkluderer den. Skjevheten er i den korte.
•Glemme at BEGGE betingelsene må holde for OVB: (1) utelatt variabel påvirker Y, OG (2) den er korrelert med X.
•Forveksle fortegnet på skjevheten. Positivt bias betyr at den korte regresjonen OVERESTIMERER koeffisienten.
•Bruke feil standardavvik når du regner ut korrelasjonen. Pass på: $r = \tilde{\delta}_1 \cdot SD(X)/SD(W)$ .

Ikke-lineære spesifikasjoner

•Glemme I() i R når du bruker transformasjoner. x^2 i feols-formelen tolkes IKKE som kvadrering — bruk I(x^2).
•Forveksle feols(y ~ x*d) med feols(y ~ x + d). Den første inkluderer interaksjonsledd, den andre gjør det ikke.
•Tolke $\beta_2$ i interaksjonsmodellen som effekten av $D$ uavhengig av $X$ . Korrekt: $\beta_2$ er skiftet i konstantledd; $\beta_3$ er skiftet i helning.
•Ikke evaluere den gjennomsnittlige marginale effekten av alderen i knekkpunktet — eksamen spør ofte om dette.

Heteroskedastisitet og robuste standardfeil

•Tro at heteroskedastisitet gjør OLS-koeffisientene feil. Koeffisientene er FORTSATT forventningsrette — bare standardfeilene er feil.
•Bruke F-test basert på SSR når standardfeilene i output er robuste. SSR-basert F-test krever homoskedastisitet.
•Glemme at RMSE² × (n-k-1) = SSR. Du trenger dette for F-tester når output gir RMSE i stedet for SSR direkte.
•Forveksle RMSE med $SD(Y)$ . RMSE = $\sqrt{SSR/(n-k-1)}$ er om residualene; $SD(Y) = \sqrt{SST/(n-1)}$ er om $Y$ .

Instrumentvariabler og Wald-estimatoren

•Forveksle first stage og reduced form. First stage: $Z$ på endogen $X$ . Reduced form: $Z$ på utfall $Y$ .
•Glemme at eksklusjonsrestriksjonen IKKE kan testes — den må argumenteres teoretisk.
•Ignorere svake instrumenter. Når $F < 10$ i first stage, er IV-estimatet upålitelig.
•Tolke IV-estimatet som ATE (Average Treatment Effect) når det er LATE.

Probit og logit-modeller

•Tolke probit/logit-koeffisienten direkte som marginal effekt. Den er IKKE marginal sannsynlighetsendring — du må multiplisere med $\phi(z)$ for probit.
•Bruke $\Phi$ -tabellen feil. For probit: finn $z = \hat{\beta}_0 + \hat{\beta}_1 X$ først, deretter $\Phi(z)$ .
•Sammenligne koeffisientstørrelser mellom probit og logit direkte — de er på ulik skala.
•Glemme at LPM kan gi predikerte sannsynligheter utenfor [0,1] — dette er en svakhet, ikke en feil i beregningene.

Paneldata og fixed effects

•Tro at FE eliminerer ALLE uobserverte variabler. FE eliminerer kun tidsinvariante konfundere — ikke tidsvaerende.
•Inkludere en variabel som er konstant over tid for enheten og entity FE — variabelen faller bort.
•Inkludere alle tidsdummyer og en krise-dummy som varierer kun over tid — perfekt kollinearitet.
•Tolke FE-koeffisienten som en «mellom-enhet»-sammenligning. FE gir only within-enhet-estimat (tidsserie-variasjon).

Difference-in-differences

•Beregne bare enkle differanser (før–etter for behandlingsgruppen) i stedet for dobbelte differanser — enkle differanser fanger også tidseffekten.
•Glemme parallelltrendforutsetningen ved kausalitetsdiskusjon — eksamen ber ALLTID om denne.
•Forveksle interaksjonsleddet med hovedeffektene. DiD-estimatoren er koeffisienten på INTERAKSJONEN $D \times T$ .
•Bruke DiD når gruppene har ulike pre-trender — da brytes forutsetningen og estimatet er skjevt.

Regresjonsdiskontinuitet (RD)

•Behandle en fuzzy RD som skarp. Når ikke alle berettigede tar behandlingen, MÅ du bruke 2SLS med terskelindikatoren som instrument.
•Glemme å kontrollere for en kontinuerlig funksjon av løpevariabelen. Uten $(r_i - c)$ fanger $\beta_1$ også den glatte trenden, ikke bare hoppet.
•Tolke RD-estimatet globalt. Det er en LOKAL effekt ved terskelen — ikke nødvendigvis gyldig for individer langt fra $c$ .
•Hevde kausalitet uten å diskutere kontinuitet/manipulasjon. Bunching ved terskelen ugyldiggjør designet.

Kausal inferens og indre gyldighet

•Konkludere med kausalitet bare fordi koeffisienten er signifikant. Signifikans sier ingenting om kausalitet.
•Glemme å diskutere SPESIFIKKE utelatte variabler — ikke bare «det kan finnes utelatte variabler». Navngi dem og argumenter for retning på bias.
•Forveksle intern og ekstern gyldighet. Intern gyldighet: er estimatet kausalt? Ekstern gyldighet: kan vi generalisere?
•Tro at flere kontrollvariabler alltid er bedre. Kontroll for en «bad control» (variabel påvirket av behandlingen) kan introdusere ny skjevhet.

Statistisk presisjon og store utvalg

•Forveksle forventningsretthet og konsistens. En estimator kan være konsistent men ikke forventningsrett (f.eks. IV i endelige utvalg).
•Tro at stort utvalg løser alle problemer. Stort $n$ gir presisjon, men ikke kausalitet — OVB forsvinner ikke med $n$ .
•Glemme at CLT gjelder asymptotisk. Med $n=3$ (V2025 Spørsmål 1) er normalapproksimasjon svak.
•Lese av KI-bredden feil. 95%-KI har total bredde $2 \times 1.96 \times SE$ , ikke $1.96 \times SE$ .

Eksamenstips

OLS-estimering og tolkning

•Start alltid tolkningen med å identifisere funksjonell form: er avhengig/uavhengig variabel i log eller level?
•Når eksamen ber deg tolke konstantleddet, sett alle uavhengige variabler til null (eller referansekategorien for dummyer).
•V2024 og V2025 hadde begge oppgaver om skaleringsendring. Husk: endring i måleenhet på Y skalerer ALLE koeffisienter (level-level); for log-level endrer kun konstantleddet seg.
•cor(predict(reg), actual)^2 = R². Dette ble spurt direkte på V2024 — hold det klart.

Hypotesetesting og konfidensintervaller

•Eksamen vedlegger alltid $\Phi(z)$ -tabellen og $F_{m,\infty}$ -tabellen. Øv på å lese av korrekte kritiske verdier raskt.
•68%-KI spørres jevnlig (V2022). Husk at det er $\pm 1 \cdot SE$ — mye enklere enn 95%-KI.
•t² = F med 1 restriksjon. En t-test på én koeffisient tilsvarer F-test med q = 1. Nyttig krysssjekk.
•Når eksamen ber om intercept-test ( $H_0: \beta_0 = 100$ ), bruk samme t-formel med $\beta_{j,0} = 100$ .

Multippel regresjon og modellvalg

•F-test er på ALLE eksamener. Lær begge formlene (SSR og R²) utenat — R²-formelen er raskest når eksamen gir R².
•Eksamen gir F-tabellen med $m = 1,\ldots,30$ og signifikansnivå 10%, 5%, 1%. Les tabellen nøye og velg riktig $m = q$ .
•t² = F med q = 1. Du kan krysssjekke din F-beregning mot t-verdien fra output.
•Spørsmål om «overordnet F-test» (overall F-test): test at ALLE koeffisienter unntatt konstantleddet er null. Da er den restringerte modellen bare $\hat{Y} = \bar{Y}$ .

Utelatt variabel-bias og OVB-formelen

•OVB-oppgaven er på ALLE eksamener. Det er det viktigste enkeltbegrepet på kurset.
•Når eksamen ber deg «explain why the coefficient dropped», er svaret alltid OVB — navn den utelatte variabelen og argumenter for retningen.
•Du kan bruke OVB-formelen baklengs for å finne korrelasjoner mellom variabler — dette er en gjenganger (V2023, V2025).
•OVB er uunngåelig med observasjonsdata. Når eksamen spør «can we give this a causal interpretation?», diskuter alltid mulige utelatte variabler.

Ikke-lineære spesifikasjoner

•V2025 Oppgave 2 krevde at du identifiserte 4 ulike spesifikasjoner fra grafer. Øv på å gjenkjenne mønstre.
•V2022 hadde oppgave om gjennomsnittlig marginal effekt av alder og standardfeil til lineærkombinasjon av koeffisienter — sentralt tema.
•V2023 spørte om å sette opp interaksjonsmodellen for å teste heterogene effekter. Vet du formelen for null-hypotesen ( $H_0: \beta_3 = 0$ )?
•Resentrering ( $X - c$ i stedet for $X$ ): helningskoeffisienter er uendret; kun konstantleddet endres. Nyttig å huske for polynomspørsmål.

Heteroskedastisitet og robuste standardfeil

•Sjekk alltid «S.E. type» i regresjonsoutput. Det avgjør hvilken type test du kan gjøre.
•Når eksamen sier «assuming homoskedasticity», er det signal om at du skal bruke SSR-formelen for F-testen.
•V2023 brukte robuste SE i alle regresjoner, men ba om F-test under homoskedastisitet — du kan fortsatt beregne F fra RMSE.
•Klyngerobuste standardfeil er relevante i paneldata-kontekst. Eksamen nevner dem ikke alltid, men forstå konseptet.

Instrumentvariabler og Wald-estimatoren

•IV-oppgaven er på V2021–V2024. Forvent den hvert år. Den utgjør typisk 20–40% av eksamen.
•Når eksamen gir gjennomsnitt fordelt på instrumentgrupper, bruk Wald-estimatoren direkte.
•Diskuter ALLTID både relevans (F-test i first stage) OG eksklusjonsrestriksjon. Eksamen ber eksplisitt om begge.
•Når du har R-output med first stage og reduced form, beregn IV = koeffisient på Z i reduced form / koeffisient på Z i first stage.

Probit og logit-modeller

•Probit/logit er testet på V2021 (lavere vekting). Fokuser på predikerte sannsynligheter og marginal effekt.
•Eksamen vedlegger $\Phi$ -tabellen — bruk den for å beregne probit-prediksjoner.
•Nøkkelferdighet: beregn predikert sannsynlighet for et spesifikt individ (sett inn kovariater, beregn $z$ , finn $\Phi(z)$ ).
•Diskuter om LPM er et godt alternativ: enkler tolkning, men kan gi sannsynligheter < 0 eller > 1 for ekstremverdier.

Paneldata og fixed effects

•Paneldata er testet på V2021. Fokuser på å forklare hva FE eliminerer og hvorfor det hjelper mot OVB.
•Eksamen spør ofte om Wald-estimatoren med IV i paneldata-kontekst — forstå sammenhengen mellom krise-dummy (instrument) og FE.
•Kollinearitet med års-dummyer + tidsvarierende krise-dummy er en klassisk «felle» (V2021 spørsmål 2f).
•R-syntaks i fixest: fixed effects etter |. feols(y ~ x | enhet + år, data).

Difference-in-differences

•DiD-oppgaven på V2023 fulgte eksakt mønsteret: 2×2-tabell med gjennomsnitt, beregn DiD, diskuter forutsetninger.
•Vis alltid beregningen i to steg: (1) differanse innad i hver gruppe over tid, (2) differanse mellom gruppene.
•Når eksamen spør om kausal tolkning: diskuter parallelltrendforutsetningen og eventuelle trusler mot den.
•DiD kan utvides med kontrollvariabler og faste effekter: feols(Y ~ D:T + X | gruppe + tid, data).

Regresjonsdiskontinuitet (RD)

•Gjenkjenn RD fra signalord: behandling/rett tildeles ved at en skår «overstiger en terskel/grense». V2025 Spørsmål 4 fulgte dette eksakt.
•Står det «not all who could actually did»? Da er det FUZZY RD = 2SLS med $\mathbf{1}(r \geq c)$ som instrument. Skriv ut begge trinn.
•Tolkningen er en LATE ved terskelen: effekten for compliers med løpevariabel akkurat på grensen. Nevn at den blir lokal.
•Når eksamen ber om en «shortcoming»: nevn funksjonsform (test fleksible spesifikasjoner) OG manipulasjon (tetthetshistogram + balansesjekk på kovariater).

Kausal inferens og indre gyldighet

•Når eksamen spør «can we give this a causal interpretation?», er svaret nesten alltid NEI med OLS på observasjonsdata — diskuter spesifikke OVB-trusler.
•Når du diskuterer IV-gyldighet: ta både relevans (testbar med F) og eksklusjonsrestriksjon (ikke testbar).
•Bruk OVB-formelen for å argumentere for RETNINGEN på bias — dette imponerer sensor.
•Eksamenseksempler: V2021 (noncompliance i eksperiment), V2022 (medisinsk skole/inntekt med lottery), V2023 (roking og fødselsvekt), V2024 (katolsk skole). Forbered standard-argumenter for ulike kontekster.

Statistisk presisjon og store utvalg

•V2025 Spørsmål 1 var direkte om statistisk presisjon — les standardfeil fra KI, beregn utvalgsstørrelse fra p-verdi.
•Husk: KI-bredde $= 2 \times z_{\alpha/2} \times SE$ . Fra bredde: $SE = \text{bredde}/(2 \times z_{\alpha/2})$ .
•Sammenhengen $SE \propto 1/\sqrt{n}$ gir: for å halvere SE, trenger du 4× så mange observasjoner.
•Eksamen kan be deg lese av SE fra en figur (scatterplot med usikkerhetsbånd) — se nøye på akselabels.

ECON3150

Cheat Sheet

Formler, begreper og oppsummering

Introductory Econometrics

eksamenssett.no

Nøkkelformler per tema

OLS-estimering og tolkning

• $\hat{\beta}_1 = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sum_{i=1}^n (X_i - \bar{X})^2}$ (OLS-estimator)
• $R^2 = 1 - \frac{SSR}{SST} = \text{Cor}(\hat{Y}_i, Y_i)^2$
• $\text{RMSE} = \sqrt{\frac{SSR}{n-k-1}}, \quad R^2 = 1 - \frac{\text{RMSE}^2 \cdot (n-k-1)}{(n-1) \cdot SD(Y)^2}$
•Log-level: $\%\Delta Y \approx 100 \beta_1 \cdot \Delta X$ (tilnærming for liten $\beta_1$ )
•Log-log (elastisitet): $\%\Delta Y \approx \beta_1 \cdot \%\Delta X$

Hypotesetesting og konfidensintervaller

• $t = \frac{\hat{\beta}_j - \beta_{j,0}}{SE(\hat{\beta}_j)}$ (t-statistikk)
• $KI_{1-\alpha} = \hat{\beta}_j \pm z_{\alpha/2} \cdot SE(\hat{\beta}_j)$
•Kritiske verdier: $z_{0.10} = 1.28$ , $z_{0.05} = 1.64$ , $z_{0.025} = 1.96$ , $z_{0.005} = 2.58$
•P-verdi (tosidig): $p = 2 \cdot \Phi(-|t|) = 2 \cdot (1 - \Phi(|t|))$
•68%-KI: $\hat{\beta}_j \pm 1.00 \cdot SE$ (bredde = $\pm 1$ standardfeil)

Multippel regresjon og modellvalg

• $F = \frac{(SSR_r - SSR_{ur})/q}{SSR_{ur}/(n-k-1)}$ (F-test med SSR, krever homoskedastisitet)
• $F = \frac{(R^2_{ur} - R^2_r)/q}{(1-R^2_{ur})/(n-k_{ur}-1)}$ (F-test med $R^2$ )
• $\bar{R}^2 = 1 - \frac{(1-R^2)(n-1)}{n-k-1}$ (Justert R²)
•RMSE²·(n-k-1) = SSR (nyttig når eksamen gir RMSE)
•Skalering av Y: alle $\hat{\beta}_j$ og SE multipliseres med skaleringsfaktoren; $R^2$ er uendret

Utelatt variabel-bias og OVB-formelen

• $\tilde{\beta}_1 = \hat{\beta}_1 + \hat{\beta}_2 \cdot \tilde{\delta}_1$ (OVB: kort = lang + bias)
•Bias = $\hat{\beta}_2 \cdot \tilde{\delta}_1$ = (effekt av utelatt variabel på Y) × (korrelasjon med X)
• $\tilde{\delta}_1 = \frac{\tilde{\beta}_1 - \hat{\beta}_1}{\hat{\beta}_2}$ (utled delta fra to regresjoner)
• $r_{XW} = \tilde{\delta}_1 \cdot \frac{SD(X)}{SD(W)}$ (korrelasjon fra OVB)

Ikke-lineære spesifikasjoner

•Kvadratisk: $Y_i = \beta_0 + \beta_1 X_i + \beta_2 X_i^2 + u_i$ , marginal effekt $= \beta_1 + 2\beta_2 X$
•Knekkpunkt: $X^* = -\beta_1/(2\beta_2)$ (maksimum/minimum for kvadratisk modell)
•Interaksjon: $Y_i = \beta_0 + \beta_1 X_i + \beta_2 D_i + \beta_3 (X_i \cdot D_i) + u_i$
•R: feols(y ~ x + I(x^2), data) for kvadratisk; feols(y ~ x*d, data) for interaksjon
•Gjennomsnittlig marginal effekt av alder: $\hat{\beta}_1 + 2\hat{\beta}_2 \bar{X}$

Heteroskedastisitet og robuste standardfeil

•IID: $\displaystyle SE(\hat{\beta}_1) = \sqrt{\hat{\sigma}^2 / \sum(X_i - \bar{X})^2}$ , $\hat{\sigma}^2 = SSR/(n-k-1)$
•HC-robust SE bruker $\hat{\Omega} = \text{diag}(\hat{u}_1^2, \ldots, \hat{u}_n^2)$
•Gauss-Markov: OLS er BLUE under homoskedastisitet, normalitet ikke nødvendig
•SSR = RMSE² × (n − k − 1) (nyttig for F-test fra output)

Instrumentvariabler og Wald-estimatoren

• $\hat{\beta}_{\text{Wald}} = \frac{\bar{Y}_{Z=1} - \bar{Y}_{Z=0}}{\bar{X}_{Z=1} - \bar{X}_{Z=0}} = \frac{\text{Reduced form}}{\text{First stage}}$
•Relevanskrav: $\text{Cov}(Z_i, X_i) \neq 0$ , test: $F_{\text{first stage}} > 10$
•Eksklusjonsrestriksjon: $\text{Cov}(Z_i, u_i) = 0$ (ikke testbar empirisk)
•R: feols(Y ~ W | X ~ Z, data) (2SLS i fixest)
•LATE = effekten for compliers (de som endrer $X$ pga. $Z$ )

Probit og logit-modeller

•Probit: $P(Y=1|X) = \Phi(\beta_0 + \beta_1 X)$
•Logit: $P(Y=1|X) = \Lambda(\beta_0 + \beta_1 X) = e^{\beta_0 + \beta_1 X}/(1+e^{\beta_0 + \beta_1 X})$
•Marginal effekt (probit): $\phi(z) \cdot \hat{\beta}_1$ der $z = \hat{\beta}_0 + \hat{\beta}_1 X$ og $\phi = \Phi'$
•LPM: $P(Y=1|X) = \beta_0 + \beta_1 X$ (OLS på binær variabel)

Paneldata og fixed effects

•FE-modell: $Y_{it} = \beta_0 + \beta_1 X_{it} + \eta_i + \varepsilon_{it}$
•Within-transformasjon: $\tilde{Y}_{it} = Y_{it} - \bar{Y}_{i}$ , $\tilde{X}_{it} = X_{it} - \bar{X}_{i}$
•Toveis FE: $Y_{it} = \beta_1 X_{it} + \eta_i + \lambda_t + \varepsilon_{it}$
•R: feols(Y ~ X | id, data) (entity FE); feols(Y ~ X | id + year, data) (toveis FE)

Difference-in-differences

• $\hat{\delta}_{\text{DiD}} = (\bar{Y}_{11} - \bar{Y}_{10}) - (\bar{Y}_{01} - \bar{Y}_{00})$
•DiD-regresjon: $Y_{it} = \beta_0 + \beta_1 D_i + \beta_2 T_t + \delta (D_i \cdot T_t) + u_{it}$
• $\delta$ er den kausale effekten under parallelltrendforutsetningen
•R: feols(Y ~ D + T + D:T, data)

Regresjonsdiskontinuitet (RD)

•Skarp RD: $Y_i = \beta_0 + \beta_1 \mathbf{1}(r_i \geq c) + \beta_2(r_i - c) + u_i$
•Fuzzy RD første trinn: $D_i = \pi_0 + \pi_1 \mathbf{1}(r_i \geq c) + \pi_2(r_i - c) + v_i$
•Fuzzy RD andre trinn: $Y_i = \beta_0 + \beta_1 D_i + \beta_2(r_i - c) + u_i$ ( $\beta_1$ = LATE ved terskelen)
•R (fuzzy): feols(Y ~ I(run - c) | D ~ I(run >= c), data)
•Kontinuitetsantakelse: potensielle utfall er kontinuerlige i $r$ ved $c$

Kausal inferens og indre gyldighet

• $E[u_i | X_i] = 0$ (betinget gjennomsnittsuavhengighet — betingelse for kausal OLS)
•CIA: $E[u_i | X_i, W_i] = 0$ (selection on observables)
•ITT: sammenlign tildelte grupper uansett etterlevelse
•LATE = $\hat{\beta}_{\text{Wald}}$ = ITT-effekt / First stage-effekt

Statistisk presisjon og store utvalg

• $SE(\hat{\beta}_1) = \frac{\hat{\sigma}}{\sqrt{n} \cdot SD(X)}$ — omvendt prop. med $\sqrt{n}$
• $\frac{\hat{\beta}_j - \beta_j}{SE(\hat{\beta}_j)} \xrightarrow{d} N(0,1)$ (CLT for OLS)
•Forventningsrett: $E[\hat{\beta}] = \beta$ (for alle $n$ ). Konsistent: $\hat{\beta} \xrightarrow{p} \beta$ ( $n \to \infty$ )
•KI-bredde halveres når $n$ firedobles (prop. med $1/\sqrt{n}$ )

Vanlige feil å unngå

OLS-estimering og tolkning

•Forveksle prosentpoeng og prosent. Når avhengig variabel er en sannsynlighet (0–1), er koeffisienten i prosentpoeng, IKKE prosent.
•Glemme å nevne referansegruppen når du tolker dummyvariabler. Koeffisienten er alltid RELATIVT til den utelatte kategorien.
•Tolke log-level-koeffisienter feil: $\beta_1 = 0.05$ betyr ca. 5% økning, IKKE 0.05% økning.
•Beregne R² feil fra RMSE: husk å justere for frihetsgrader med $(n-k-1)$ og $(n-1)$ .

Hypotesetesting og konfidensintervaller

•Bruke feil kritisk verdi for ensidig vs. tosidig test. For ensidig test: $z_{0.10} = 1.28$ (ikke 1.64).
•Lese feil av $\Phi$ -tabellen. Husk: tabellen gir $P(Z \leq z)$ . For $z_{0.025}$ : finn $z$ der $\Phi(z) = 0.975$ , ikke $0.025$ .
•Forveksle signifikansnivå og konfidensnivå. 5% signifikansnivå = 95% konfidensnivå.
•Oppgi p-verdi for tosidig test som ensidig. Les alltid oppgaveteksten: «two-sided» er standard.

Multippel regresjon og modellvalg

•Bruke feil frihetsgrader i F-testen. $q$ er antall restriksjoner (koeffisienter satt til null), IKKE antall variabler i modellen.
•Konkludere med at en modell er «bedre» bare fordi $R^2$ er høyere. Høyere $R^2$ kan skyldes at vi la til irrelevante variabler.
•Glemme å justere for frihetsgrader når du beregner $R^2$ fra RMSE: husk faktoren $(n-k-1)$ .
•Tolke multippel regresjonskoeffisient som enkel regresjon. I multippel regresjon er $\hat{\beta}_1$ ceteris paribus — det er ikke det samme som i enkel regresjon.

Utelatt variabel-bias og OVB-formelen

•Blande «kort» og «lang» regresjon. Den KORTE mangler variabelen, den LANGE inkluderer den. Skjevheten er i den korte.
•Glemme at BEGGE betingelsene må holde for OVB: (1) utelatt variabel påvirker Y, OG (2) den er korrelert med X.
•Forveksle fortegnet på skjevheten. Positivt bias betyr at den korte regresjonen OVERESTIMERER koeffisienten.
•Bruke feil standardavvik når du regner ut korrelasjonen. Pass på: $r = \tilde{\delta}_1 \cdot SD(X)/SD(W)$ .

Ikke-lineære spesifikasjoner

•Glemme I() i R når du bruker transformasjoner. x^2 i feols-formelen tolkes IKKE som kvadrering — bruk I(x^2).
•Forveksle feols(y ~ x*d) med feols(y ~ x + d). Den første inkluderer interaksjonsledd, den andre gjør det ikke.
•Tolke $\beta_2$ i interaksjonsmodellen som effekten av $D$ uavhengig av $X$ . Korrekt: $\beta_2$ er skiftet i konstantledd; $\beta_3$ er skiftet i helning.
•Ikke evaluere den gjennomsnittlige marginale effekten av alderen i knekkpunktet — eksamen spør ofte om dette.

Heteroskedastisitet og robuste standardfeil

•Tro at heteroskedastisitet gjør OLS-koeffisientene feil. Koeffisientene er FORTSATT forventningsrette — bare standardfeilene er feil.
•Bruke F-test basert på SSR når standardfeilene i output er robuste. SSR-basert F-test krever homoskedastisitet.
•Glemme at RMSE² × (n-k-1) = SSR. Du trenger dette for F-tester når output gir RMSE i stedet for SSR direkte.
•Forveksle RMSE med $SD(Y)$ . RMSE = $\sqrt{SSR/(n-k-1)}$ er om residualene; $SD(Y) = \sqrt{SST/(n-1)}$ er om $Y$ .

Instrumentvariabler og Wald-estimatoren

•Forveksle first stage og reduced form. First stage: $Z$ på endogen $X$ . Reduced form: $Z$ på utfall $Y$ .
•Glemme at eksklusjonsrestriksjonen IKKE kan testes — den må argumenteres teoretisk.
•Ignorere svake instrumenter. Når $F < 10$ i first stage, er IV-estimatet upålitelig.
•Tolke IV-estimatet som ATE (Average Treatment Effect) når det er LATE.

Probit og logit-modeller

•Tolke probit/logit-koeffisienten direkte som marginal effekt. Den er IKKE marginal sannsynlighetsendring — du må multiplisere med $\phi(z)$ for probit.
•Bruke $\Phi$ -tabellen feil. For probit: finn $z = \hat{\beta}_0 + \hat{\beta}_1 X$ først, deretter $\Phi(z)$ .
•Sammenligne koeffisientstørrelser mellom probit og logit direkte — de er på ulik skala.
•Glemme at LPM kan gi predikerte sannsynligheter utenfor [0,1] — dette er en svakhet, ikke en feil i beregningene.

Paneldata og fixed effects

•Tro at FE eliminerer ALLE uobserverte variabler. FE eliminerer kun tidsinvariante konfundere — ikke tidsvaerende.
•Inkludere en variabel som er konstant over tid for enheten og entity FE — variabelen faller bort.
•Inkludere alle tidsdummyer og en krise-dummy som varierer kun over tid — perfekt kollinearitet.
•Tolke FE-koeffisienten som en «mellom-enhet»-sammenligning. FE gir only within-enhet-estimat (tidsserie-variasjon).

Difference-in-differences

•Beregne bare enkle differanser (før–etter for behandlingsgruppen) i stedet for dobbelte differanser — enkle differanser fanger også tidseffekten.
•Glemme parallelltrendforutsetningen ved kausalitetsdiskusjon — eksamen ber ALLTID om denne.
•Forveksle interaksjonsleddet med hovedeffektene. DiD-estimatoren er koeffisienten på INTERAKSJONEN $D \times T$ .
•Bruke DiD når gruppene har ulike pre-trender — da brytes forutsetningen og estimatet er skjevt.

Regresjonsdiskontinuitet (RD)

•Behandle en fuzzy RD som skarp. Når ikke alle berettigede tar behandlingen, MÅ du bruke 2SLS med terskelindikatoren som instrument.
•Glemme å kontrollere for en kontinuerlig funksjon av løpevariabelen. Uten $(r_i - c)$ fanger $\beta_1$ også den glatte trenden, ikke bare hoppet.
•Tolke RD-estimatet globalt. Det er en LOKAL effekt ved terskelen — ikke nødvendigvis gyldig for individer langt fra $c$ .
•Hevde kausalitet uten å diskutere kontinuitet/manipulasjon. Bunching ved terskelen ugyldiggjør designet.

Kausal inferens og indre gyldighet

•Konkludere med kausalitet bare fordi koeffisienten er signifikant. Signifikans sier ingenting om kausalitet.
•Glemme å diskutere SPESIFIKKE utelatte variabler — ikke bare «det kan finnes utelatte variabler». Navngi dem og argumenter for retning på bias.
•Forveksle intern og ekstern gyldighet. Intern gyldighet: er estimatet kausalt? Ekstern gyldighet: kan vi generalisere?
•Tro at flere kontrollvariabler alltid er bedre. Kontroll for en «bad control» (variabel påvirket av behandlingen) kan introdusere ny skjevhet.

Statistisk presisjon og store utvalg

•Forveksle forventningsretthet og konsistens. En estimator kan være konsistent men ikke forventningsrett (f.eks. IV i endelige utvalg).
•Tro at stort utvalg løser alle problemer. Stort $n$ gir presisjon, men ikke kausalitet — OVB forsvinner ikke med $n$ .
•Glemme at CLT gjelder asymptotisk. Med $n=3$ (V2025 Spørsmål 1) er normalapproksimasjon svak.
•Lese av KI-bredden feil. 95%-KI har total bredde $2 \times 1.96 \times SE$ , ikke $1.96 \times SE$ .

Eksamenstips

OLS-estimering og tolkning

•Start alltid tolkningen med å identifisere funksjonell form: er avhengig/uavhengig variabel i log eller level?
•Når eksamen ber deg tolke konstantleddet, sett alle uavhengige variabler til null (eller referansekategorien for dummyer).
•V2024 og V2025 hadde begge oppgaver om skaleringsendring. Husk: endring i måleenhet på Y skalerer ALLE koeffisienter (level-level); for log-level endrer kun konstantleddet seg.
•cor(predict(reg), actual)^2 = R². Dette ble spurt direkte på V2024 — hold det klart.

Hypotesetesting og konfidensintervaller

•Eksamen vedlegger alltid $\Phi(z)$ -tabellen og $F_{m,\infty}$ -tabellen. Øv på å lese av korrekte kritiske verdier raskt.
•68%-KI spørres jevnlig (V2022). Husk at det er $\pm 1 \cdot SE$ — mye enklere enn 95%-KI.
•t² = F med 1 restriksjon. En t-test på én koeffisient tilsvarer F-test med q = 1. Nyttig krysssjekk.
•Når eksamen ber om intercept-test ( $H_0: \beta_0 = 100$ ), bruk samme t-formel med $\beta_{j,0} = 100$ .

Multippel regresjon og modellvalg

•F-test er på ALLE eksamener. Lær begge formlene (SSR og R²) utenat — R²-formelen er raskest når eksamen gir R².
•Eksamen gir F-tabellen med $m = 1,\ldots,30$ og signifikansnivå 10%, 5%, 1%. Les tabellen nøye og velg riktig $m = q$ .
•t² = F med q = 1. Du kan krysssjekke din F-beregning mot t-verdien fra output.
•Spørsmål om «overordnet F-test» (overall F-test): test at ALLE koeffisienter unntatt konstantleddet er null. Da er den restringerte modellen bare $\hat{Y} = \bar{Y}$ .

Utelatt variabel-bias og OVB-formelen

•OVB-oppgaven er på ALLE eksamener. Det er det viktigste enkeltbegrepet på kurset.
•Når eksamen ber deg «explain why the coefficient dropped», er svaret alltid OVB — navn den utelatte variabelen og argumenter for retningen.
•Du kan bruke OVB-formelen baklengs for å finne korrelasjoner mellom variabler — dette er en gjenganger (V2023, V2025).
•OVB er uunngåelig med observasjonsdata. Når eksamen spør «can we give this a causal interpretation?», diskuter alltid mulige utelatte variabler.

Ikke-lineære spesifikasjoner

•V2025 Oppgave 2 krevde at du identifiserte 4 ulike spesifikasjoner fra grafer. Øv på å gjenkjenne mønstre.
•V2022 hadde oppgave om gjennomsnittlig marginal effekt av alder og standardfeil til lineærkombinasjon av koeffisienter — sentralt tema.
•V2023 spørte om å sette opp interaksjonsmodellen for å teste heterogene effekter. Vet du formelen for null-hypotesen ( $H_0: \beta_3 = 0$ )?
•Resentrering ( $X - c$ i stedet for $X$ ): helningskoeffisienter er uendret; kun konstantleddet endres. Nyttig å huske for polynomspørsmål.

Heteroskedastisitet og robuste standardfeil

•Sjekk alltid «S.E. type» i regresjonsoutput. Det avgjør hvilken type test du kan gjøre.
•Når eksamen sier «assuming homoskedasticity», er det signal om at du skal bruke SSR-formelen for F-testen.
•V2023 brukte robuste SE i alle regresjoner, men ba om F-test under homoskedastisitet — du kan fortsatt beregne F fra RMSE.
•Klyngerobuste standardfeil er relevante i paneldata-kontekst. Eksamen nevner dem ikke alltid, men forstå konseptet.

Instrumentvariabler og Wald-estimatoren

•IV-oppgaven er på V2021–V2024. Forvent den hvert år. Den utgjør typisk 20–40% av eksamen.
•Når eksamen gir gjennomsnitt fordelt på instrumentgrupper, bruk Wald-estimatoren direkte.
•Diskuter ALLTID både relevans (F-test i first stage) OG eksklusjonsrestriksjon. Eksamen ber eksplisitt om begge.
•Når du har R-output med first stage og reduced form, beregn IV = koeffisient på Z i reduced form / koeffisient på Z i first stage.

Probit og logit-modeller

•Probit/logit er testet på V2021 (lavere vekting). Fokuser på predikerte sannsynligheter og marginal effekt.
•Eksamen vedlegger $\Phi$ -tabellen — bruk den for å beregne probit-prediksjoner.
•Nøkkelferdighet: beregn predikert sannsynlighet for et spesifikt individ (sett inn kovariater, beregn $z$ , finn $\Phi(z)$ ).
•Diskuter om LPM er et godt alternativ: enkler tolkning, men kan gi sannsynligheter < 0 eller > 1 for ekstremverdier.

Paneldata og fixed effects

•Paneldata er testet på V2021. Fokuser på å forklare hva FE eliminerer og hvorfor det hjelper mot OVB.
•Eksamen spør ofte om Wald-estimatoren med IV i paneldata-kontekst — forstå sammenhengen mellom krise-dummy (instrument) og FE.
•Kollinearitet med års-dummyer + tidsvarierende krise-dummy er en klassisk «felle» (V2021 spørsmål 2f).
•R-syntaks i fixest: fixed effects etter |. feols(y ~ x | enhet + år, data).

Difference-in-differences

•DiD-oppgaven på V2023 fulgte eksakt mønsteret: 2×2-tabell med gjennomsnitt, beregn DiD, diskuter forutsetninger.
•Vis alltid beregningen i to steg: (1) differanse innad i hver gruppe over tid, (2) differanse mellom gruppene.
•Når eksamen spør om kausal tolkning: diskuter parallelltrendforutsetningen og eventuelle trusler mot den.
•DiD kan utvides med kontrollvariabler og faste effekter: feols(Y ~ D:T + X | gruppe + tid, data).

Regresjonsdiskontinuitet (RD)

•Gjenkjenn RD fra signalord: behandling/rett tildeles ved at en skår «overstiger en terskel/grense». V2025 Spørsmål 4 fulgte dette eksakt.
•Står det «not all who could actually did»? Da er det FUZZY RD = 2SLS med $\mathbf{1}(r \geq c)$ som instrument. Skriv ut begge trinn.
•Tolkningen er en LATE ved terskelen: effekten for compliers med løpevariabel akkurat på grensen. Nevn at den blir lokal.
•Når eksamen ber om en «shortcoming»: nevn funksjonsform (test fleksible spesifikasjoner) OG manipulasjon (tetthetshistogram + balansesjekk på kovariater).

Kausal inferens og indre gyldighet

•Når eksamen spør «can we give this a causal interpretation?», er svaret nesten alltid NEI med OLS på observasjonsdata — diskuter spesifikke OVB-trusler.
•Når du diskuterer IV-gyldighet: ta både relevans (testbar med F) og eksklusjonsrestriksjon (ikke testbar).
•Bruk OVB-formelen for å argumentere for RETNINGEN på bias — dette imponerer sensor.
•Eksamenseksempler: V2021 (noncompliance i eksperiment), V2022 (medisinsk skole/inntekt med lottery), V2023 (roking og fødselsvekt), V2024 (katolsk skole). Forbered standard-argumenter for ulike kontekster.

Statistisk presisjon og store utvalg

•V2025 Spørsmål 1 var direkte om statistisk presisjon — les standardfeil fra KI, beregn utvalgsstørrelse fra p-verdi.
•Husk: KI-bredde $= 2 \times z_{\alpha/2} \times SE$ . Fra bredde: $SE = \text{bredde}/(2 \times z_{\alpha/2})$ .
•Sammenhengen $SE \propto 1/\sqrt{n}$ gir: for å halvere SE, trenger du 4× så mange observasjoner.
•Eksamen kan be deg lese av SE fra en figur (scatterplot med usikkerhetsbånd) — se nøye på akselabels.