•E[ui∣Xi]=0 (Betinget gjennomsnittsuavhengighet for kausal OLS)
•CIA: E[ui∣Xi,Wi]=0 (Selection on observables)
•OVB-retning: sign(bias)=sign(β^2)×sign(δ~1)
•Svakt instrument: Ffirst stage<10⟹ upaliitelig IV
Vanlige feil å unngå
OLS-estimering og regresjonstolkning
•Forveksle prosentpoeng og prosent. Nar avhengig variabel er en sannsynlighet (0-1), er koeffisienten i prosentpoeng, IKKE prosent.
•Glemme a nevne referansegruppen nar du tolker dummyvariabler. Koeffisienten er alltid RELATIVT til den utelatte kategorien.
•Tolke log-level-koeffisienter feil: beta_1 = 0.05 betyr 5 % okning, IKKE 0.05 % okning.
•Nar pris males i 1000s USD og du bytter til USD, endres koeffisientene. Koeffisientene pa uavhengige variabler skaleres med 1000, men koeffisienten pa avhengig variabel skaleres annerledes.
Hypotesetesting og konfidensintervaller
•Bruke feil frihetsgrader i F-testen. q er antall restriksjoner (koeffisienter satt til null), IKKE antall variabler i modellen.
•Glemme a bruke F_{m,infinity}-tabellen nar n er stort. Eksamen gir ALLTID denne tabellen.
•Forveksle ensidig og tosidig test. Les oppgaveteksten nøye -- 'joint test' og 'two-sided test' er tosidig; nar oppgaven sier 'cannot have beneficial effect' antyder det ensidig test.
•Blande 'kort' og 'lang' regresjon. Den KORTE regresjonen mangler variabelen, den LANGE inkluderer den. Skjevheten er i den korte.
•Glemme at OVB-formelen krever at BEGGE betingelsene er oppfylt: (1) den utelatte variabelen pavirker Y, OG (2) den er korrelert med X.
•Forveksle fortegnet pa skjevheten. Husk: positivt bias betyr at den korte regresjonen OVERESTIMERER koeffisienten.
•Bruke OVB-formelen med feil standardavvik nar du regner ut korrelasjonen. Pass pa hvilken variabel som har hvilket SD.
Instrumentvariabler (IV) og Wald-estimatoren
•Forveksle first stage og reduced form. First stage: instrument pa endogen X. Reduced form: instrument pa utfall Y.
•Glemme at eksklusjonsrestriksjonen IKKE kan testes med data -- den ma argumenteres teoretisk.
•Ignorere svake instrumenter. Nar F < 10 i first stage, er IV-estimatet upalitelig og standardfeilene er for sma.
•Tolke IV-estimatet som ATE (Average Treatment Effect) nar det egentlig er LATE (Local Average Treatment Effect).
Difference-in-Differences (DiD)
•Beregne bare enkle differanser (foer-etter for behandlingsgruppen) i stedet for dobbelte differanser. Den enkle differansen fanger ogsa tidseffekten.
•Glemme parallelltrendantakelsen nar du diskuterer kausalitet. Eksamen ber ALLTID om denne.
•Forveksle interaksjonsleddet med hovedeffektene. DiD-estimatoren er koeffisienten pa INTERAKSJONEN, ikke pa D eller T alene.
•Bruke DiD nar gruppene har ulike pre-trender -- da brytes antakelsen og estimatet er skjevt.
Regression Discontinuity Design (RDD)
•Forveksle Sharp og Fuzzy RD. Sharp: behandling bestemmes 100% av terskelen. Fuzzy: terskelen oker sannsynligheten men bestemmer ikke fullstendig.
•Glemme a kontrollere for den lopende variabelen (running variable) i regresjonen. Uten denne kontrollen fanger du opp hele sammenhengen mellom X og Y, ikke bare hoppet.
•Ikke tillate ulik helning pa hver side av cutoff. Dette kan gi store bias i estimatet.
•Tolke Fuzzy RD som ATE nar det er LATE -- effekten gjelder kun compliers.
Modellspesifikasjon og R-kode
•Tro at alle koeffisienter endres nar du skalerer avhengig variabel i log-form. Kun konstantleddet endres (legger til ln(skaleringsfaktor)).
•Glemme I() i R nar du bruker transformasjoner. 'x^2' i feols-formelen tolkes IKKE som kvadrering -- du ma skrive I(x^2).
•Forveksle feols(y ~ x*d) med feols(y ~ x + d). Den forste inkluderer interaksjonsled, den andre gjor det ikke.
•Beregne R^2 feil fra RMSE ved a glemme justeringen for frihetsgrader.
Heteroskedastisitet og standardfeil
•Tro at heteroskedastisitet gjor OLS-koeffisientene feil. Koeffisientene er FORTSATT forventningsrette -- bare standardfeilene er feil.
•Bruke F-test basert pa SSR nar standardfeilene i output er robuste. SSR-basert F-test krever homoskedastisitet.
•Glemme a spesifisere 'assuming homoskedasticity' nar du bruker den vanlige F-formelen. Eksamen sier dette alltid eksplisitt.
•Forveksle RMSE med standardavviket til Y. RMSE = sqrt(SSR/(n-k-1)), SD(Y) = sqrt(SST/(n-1)).
Kausalitet og intern validitet
•Konkludere med kausalitet bare fordi koeffisienten er signifikant. Signifikans betyr bare at vi kan forkaste null -- det sier ingenting om kausalitet.
•Glemme a diskutere SPESIFIKKE utelatte variabler. Skriv ikke bare 'det kan vaere utelatte variabler' -- navngi dem og forklar retningen pa bias.
•Forveksle intern og ekstern validitet. Intern validitet = er estimatet kausalt? Ekstern validitet = kan vi generalisere?
•Tro at flere kontrollvariabler alltid er bedre. Kontroll for en 'bad control' (variabel som pavirkes av behandlingen) kan introdusere ny skjevhet.
Eksamenstips
OLS-estimering og regresjonstolkning
•Start alltid tolkningen med a identifisere funksjonell form: er avhengig/uavhengig variabel i log eller level?
•Nar eksamen ber deg tolke et konstantledd, sett alle uavhengige variabler til null (eller referansekategorien for dummyer).
•V2024 og V2025 hadde begge oppgaver om skaleringsendring (f.eks. fra 1000s USD til USD). Husk: endring i maleenhet pa Y skalerer ALLE koeffisienter.
•Hold tolkningen kort og presis -- eksamen ber om 'brief and to the point'.
Hypotesetesting og konfidensintervaller
•F-test er pa ALLE eksamener (V2023, V2024, V2025). Lær begge formlene (SSR og R^2) utenat.
•Eksamen gir F-tabellen med m = 1,...,30 og signifikansniva 10%, 5%, 1%. Les tabellen nøye.
•Nar du beregner R^2 fra RMSE: R^2 = 1 - RMSE^2*(n-k-1) / ((n-1)*Var(Y)).
•Tips: t^2 = F med 1 restriksjon. En t-test pa en enkelt koeffisient tilsvarer en F-test med q=1.
Utelatt-variabel-skjevhet (OVB)
•OVB-oppgaven er pa ALLE eksamener (V2023, V2024, V2025). Det er det viktigste enkeltkonspetet pa kurset.
•Nar eksamen ber deg 'explain why the coefficient dropped', er svaret ALLTID OVB.
•Du kan bruke OVB-formelen 'baklengs' for a finne korrelasjoner mellom variabler -- dette er en gjenganger.
•OVB er uunngaelig med observasjonsdata. Nar eksamen spor 'can we give this a causal interpretation?', diskuter alltid mulige utelatte variabler.
Instrumentvariabler (IV) og Wald-estimatoren
•IV-oppgaven er pa V2023 og V2024. Forvent den hvert ar. Den utgjor typisk 20-40 % av eksamen.
•Nar eksamen gir gjennomsnitt fordelt pa instrumentgrupper, bruk Wald-estimatoren direkte.
•Diskuter ALLTID bade relevans OG eksklusjonsrestriksjon. Eksamen ber eksplisitt om begge.
•Nar du far R-output med first stage og reduced form, beregn IV-estimatet som forholdet mellom koeffisientene pa instrumentet.
Difference-in-Differences (DiD)
•DiD-oppgaven pa V2023 fulgte eksakt monsteret: 2x2-tabell med gjennomsnitt, beregn DiD, diskuter antakelser.
•Vis alltid beregningen i to steg: (1) differanse innad i hver gruppe over tid, (2) differanse mellom gruppene.
•Nar eksamen spor om kausal tolkning, diskuter parallelltrendantakelsen OG eventuelle trusler mot den.
•DiD kan utvides med kontrollvariabler og faste effekter. R-kode: feols(Y ~ D:T + X | gruppe + tid, data).
Regression Discontinuity Design (RDD)
•V2025 hadde en ren RD-oppgave. Forvent dette temaet pa fremtidige eksamener.
•Nar oppgaven sier 'not all employees who could actually did that', er det FUZZY RD -- bruk IV/2SLS.
•Diskuter ALLTID antakelsene: ingen manipulasjon, kontinuitet, og relevans av first stage.
•Tegn gjerne en figur med den lopende variabelen pa x-aksen og utfallet pa y-aksen for a illustrere hoppet ved cutoff.
Modellspesifikasjon og R-kode
•V2025 Oppgave 2 krevde at du identifiserte 4 ulike spesifikasjoner fra grafer. Oev pa a gjenkjenne monstre: parallelforskyvning = dummy, ulike helninger = interaksjon, kurvet = kvadratisk/log.
•Husk: cor(predicted, actual)^2 = R^2. Dette ble spurt direkte pa V2024.
•Nar eksamen spor 'what code produces these numbers', skriv feols()-syntaksen eksakt med riktige variabelnavn.
•Ved resentrering: koeffisienten pa det kvadratiske leddet er ALLTID uendret. Kun lineaerleddet og konstantleddet endres.
Heteroskedastisitet og standardfeil
•Sjekk ALLTID 'S.E. type' i regresjonsoutput. Det avgjor hvilken type test du kan gjore.
•Nar eksamen sier 'assuming homoskedasticity', er det et signal om at du skal bruke den vanlige F-formelen med SSR.
•Husk at RMSE^2 * (n-k-1) = SSR. Du trenger dette for F-tester nar output gir RMSE i stedet for SSR.
•V2023 brukte robuste SE i alle regresjoner men ba om F-test under homoskedastisitet -- du kan fortsatt beregne F fra RMSE.
Kausalitet og intern validitet
•Nar eksamen spor 'can we give this a causal interpretation?', er svaret nesten alltid NEI med OLS pa observasjonsdata -- diskuter spesifikke OVB-trusler.
•Nar du diskuterer IV-gyldighet, ta bade relevans (testbar) og eksklusjonsrestriksjon (ikke testbar).
•Bruk OVB-formelen til a argumentere for RETNINGEN pa bias -- dette imponerer sensor.
•V2023, V2024 og V2025 har alle kausalitetsdiskusjoner. Forbered 2-3 standard-argumenter for vanlige temaer (utdanning, helse, arbeid).