•Eksponensialfordeling = Gamma(1, \(\beta\)) (nyttig for å gjenkjenne konjugert par)
Regresjon som ramme for gruppetesting
•β^0=Yˉ,β^1=Yˉ2−Yˉ1 (regresjon med \(\pm 0.5\)-koding)
•X⊤X=diag(n,∑x1i2,∑x2i2) (ortogonalt design)
•R2=r12+r22 (dekomponering ved ortogonale variabler)
•Residual standard error i regresjon = \(S_p\) i to-utvalgs t-test
Vanlige feil å unngå
Maximum likelihood-estimering (MLE)
•Glemme å sjekke at løsningen er et maksimum (ikke minimum/sadelpunkt) -- sjekk fortegnet på andrederiverten.
•Forveksle Fisher-informasjon for en observasjon I(theta) med total Fisher-informasjon nI(theta).
•Ved momentestimering: ikke nevne svakheten at ulike momenter gir ulike estimatorer -- dette var eksplisitt spurt i H2024.
•Glemme a forenkle log-likelihood for du deriverer -- det gjør regningen mye enklere.
Konfidensintervaller og hypotesetesting
•Bruke z-kvantiler når du bør bruke t-kvantiler (ved små utvalg eller estimert sigma).
•Glemme at F-testen krever normalfordelte data -- sjekk QQ-plott for dette.
•Ved tosidig test: glemme a doble P-verdien fra ensidig test, eller bruke feil halekritisk verdi.
•Blande konfidensintervall og prediksjonsintervall -- prediksjonsintervallet er alltid bredere fordi det inkluderer sigma^2.
Enkel lineaer regresjon
•Forveksle de to formene for beta1-hat: formen med (Yi - Ybar) brukes for forventningsretthet, formen med Yi(xi - xbar) brukes for varians.
•Glemme at sum(xi - xbar) = 0 -- dette er nokkelidentiteten i forventningsretthet-beviset.
•Tolke beta0 bokstavelig når x = 0 er utenfor dataomradet (ekstrapolering).
•Forveksle R^2 = 0.33 med 'darlig modell' -- i biologiske data er dette ofte akseptabelt.
Multippel lineaer regresjon
•Tro at koeffisienter i multippel regresjon har samme tolkning som i enkel -- de gir effekten av xj når de andre variablene holdes fast.
•Glemme at R^2 alltid øker med flere variable, så bruk justert R^2 for sammenligning.
•Ved matriseformulering: glemme kolonnen med enere i X-matrisen for konstantleddet.
•Forvente at koeffisienter er like i enkel og multippel regresjon -- de er bare like når variablene er ukorrelerte.
Residualanalyse og modelldiagnostikk
•Konkludere med 'darlig modell' basert på små avvik i QQ-plott -- perfekte QQ-plott finnes knapt i praksis.
•Forveksle residualer med feilledd: feilledd epsilon_i er den sanne (ukjente) storrrelsen, residualer e_i er estimerte.
•Glemme å kommentere alle tre plott når oppgaven ber om residualanalyse -- ta hvert plott for seg.
•Tolke monster i residualplott som 'tilfeldig' når det er tydelige systematiske trekk (kurve, vifte).
Modellsammenligning og multikollinearitet
•Konkludere at variable er uviktige fordi de er ikke-signifikante individuelt -- de kan være viktige samlet (multikollinearitetsfellen).
•Forveksle prediksjonsintervall og konfidensintervall -- prediksjonsintervallet er ALLTID bredere.
•Bruke R^2 alene for modellvalg -- den øker alltid med flere variable. Bruk justert R^2 eller F-test.
•Glemme at prediksjoner utenfor dataomradet (ekstrapolering) er upaalitelige.
To-utvalgsmetoder og ikke-parametriske tester
•Bruke t-test med lik varians uten å teste varianslikhet først (F-test) -- dette var eksplisitt spurt i H2023.
•Forveksle Wilcoxon signed rank (ett utvalg) med Wilcoxon rank-sum (to utvalg).
•Tro at høyere P-verdi i Wilcoxon betyr at dataene 'egentlig ikke er forskjellige' -- det betyr bare at testen har lavere styrke.
•Glemme a oppgi frihetsgrader når du bruker t- eller F-tabeller.
Styrkefunksjon, Type II-feil og utvalgsstorrelse
•Forveksle Type I (forkaste sann H0, sannsynlighet alpha) og Type II (beholde gal H0, sannsynlighet beta).
•Standardisere med mu0 i stedet for den sanne mu når man regner ut styrken -- styrken evalueres UNDER Ha.
•Glemme a runde utvalgsstorrelsen OPP til naermeste heltall.
•Tro at høyere styrke er gratis -- økt styrke krever enten større n, større effekt eller høyere alpha.
Bayesiansk analyse
•Glemme at 'proposjonal med' betyr at du kan ignorere konstanter som ikke avhenger av theta.
•Ikke gjenkjenne gamma-kjernen: lambda^{a-1} e^{-lambda/b} er Gamma(a, b). Oev på å identifisere dette.
•Forveksle prior-parametre med data -- prioren er det du tror FoR du ser data.
•Tro at Bayesiansk analyse alltid gir andre svar enn MLE -- med mye data konvergerer de.
Regresjon som ramme for gruppetesting
•Tro at regresjon og t-test gir ulike svar -- med riktig koding gir de IDENTISKE resultater.
•Glemme at R^2-dekomponeringen kun gjelder når variablene er ortogonale.
•Forveksle 0/1-koding med +/-0.5-koding -- de gir forskjellig tolkning av beta0.
•Glemme at fordelen med multippel regresjon er lavere sigma-hat, selv om koeffisientene er uendret.
Eksamenstips
Maximum likelihood-estimering (MLE)
•MLE-utledning kommer på nesten ALLE eksamener (H2023, H2024, H2025). Drill fremgangsmaaten.
•Oppgaven sier ofte 'vis at MLE er ...' -- da trenger du bare å derivere log-likelihood og vise at resultatet stemmer.
•Fisher-informasjon brukes til å finne asymptotisk varians, som igjen gir konfidensintervaller.
•Momentestimatoren \(\bar{X} = E(X)\) er alltid et godt første steg, men MLE er oftest mer effisient.
Konfidensintervaller og hypotesetesting
•Les R-utskriften nøyaktig: Estimate, Std. Error, t value og Pr(>|t|) gir deg alt du trenger.
•Når oppgaven ber om P-verdi via en tabell, bruk ulikheter for å angi et intervall P-verdien ligger i.
•Ett-utvalgs t-test/KI for en normal-forventning er den hyppigste innledningsoppgaven historisk (2013, 2017, 2019, 2020, 2022) -- drill både tosidig og ensidig variant.
•Vis dualiteten eksplisitt: KI = mengden mu0 som ikke forkastes. Dette er spurt direkte (H2017).
•'Forklar hva en P-verdi er' kommer ofte som eget delspm -- har en presis definisjon klar (sannsynlighet UNDER H0 for minst like ekstremt utfall).
•Pass på kjent vs. ukjent sigma: kjent sigma gir z-kvantil, ukjent gir t-kvantil med n-1 frihetsgrader.
•Husk at KI for mu1-mu2 som ikke inneholder 0 betyr signifikant forskjell på tilsvarende niva.
Enkel lineaer regresjon
•Beviset for Var(beta1-hat) er spurt i H2024. Bruk formen med Yi(xi-xbar) og at Yi er uavhengige.
•Når R-utskrift gis: les av ALLE noykkeltall (estimater, SE, t, p, R^2, sigma-hat, frihetsgrader).
•Husk at Residual standard error i R = sigma-hat, og frihetsgrader = n - (antall parametre).
•For 95 % KI for beta1: beta1-hat +/- t_{alpha/2, n-2} * se(beta1-hat). Bruk oppgitt kvantiletabell.
Multippel lineaer regresjon
•Matrise-utledningen (vis normallikningene, los på matriseform) var eksplisitt spurt i H2024 og H2025.
•Når oppgaven gir både enkel og multippel utskrift: sammenlign koeffisienter, R^2, og sigma-hat.
•Ortogonale variable (sentrert + ukorrelert) er et yndet tema -- vet du dette, forenkles alt drastisk.
•Husk: R^2 = r^2 gjelder KUN for enkel regresjon. For multippel regresjon er R^2 = korrelasjon(Y, Y-hat)^2.
Residualanalyse og modelldiagnostikk
•Residualplott-tolkning var eksplisitt i H2024. Forvent slike oppgaver hvert ar.