•E(SX2)=σ2 (Utvalgsvariansen er forventningsrett)
Kovarians og korrelasjon
•sXY=n−11∑(xi−xˉ)(yi−yˉ) (Utvalgkovarians)
•rXY=sX⋅sYsXY (Utvalgskorrelasjon)
•Var(aX+bY)=a2Var(X)+b2Var(Y)+2ab⋅Cov(X,Y)
•ρ(X,Y)=Std(X)⋅Std(Y)Cov(X,Y)
Konfidensintervall
•xˉ±tα/2⋅nsX (KI for mu, sigma ukjent)
•xˉ±zα/2⋅nσ (KI for mu, sigma kjent)
•p^±zα/2np^(1−p^) (KI for p)
•95% KI: z0.025=1.960, 90% KI: z0.05=1.645
Hypotesetesting
•z=p0(1−p0)/np^−p0 (z-test for andel)
•t=sX/nxˉ−μ0 (t-test for gjennomsnitt)
•Forkast H0 dersom p-verdi < alpha
•Ensidig: tα, Tosidig: tα/2
Regresjon
•β^2=sX2sXY=∑(xi−xˉ)2∑(xi−xˉ)(yi−yˉ)
•β^1=yˉ−β^2xˉ
•SE(β^2)=σ^⋅∑(xi−xˉ)21
•t=SE(β^j)β^j−β∗ med df=n−2
R-programmering
•pnorm(x, mean, sd): P(X≤x) for normalfordeling
•dbinom(k, size, prob): P(X=k) (noyaktig k suksesser)
•pbinom(k, size, prob): P(X≤k) (kumulativ)
•qt(p, df, lower.tail=FALSE): kritisk t-verdi
•prop.test(x, n, p, alternative, correct=FALSE): andelstest
Vanlige feil å unngå
Deskriptiv statistikk
•Dele pa n i stedet for n-1 i utvalgsvariansen. Husk: sd(x) i R bruker n-1.
•Blande varians (kvadrerte enheter) og standardavvik (same enhet som data).
•Glemme a sortere dataene for beregning av median.
•Forveksle utvalgsstatistikk (bar{x}, s) med populasjonsparametre (mu, sigma).
Sannsynlighet
•Blande disjunkte og uavhengige hendelser. De er helt forskjellige konsepter!
•Anta at P(A|B) = P(B|A). Dette gjelder generelt IKKE.
•Glemme a trekke fra P(A snitt B) i addisjonsregelen.
•Bruke multiplikasjonsregelen for uavhengige hendelser nar hendelsene faktisk er avhengige.
Binomisk fordeling
•Blande dbinom (punktsannsynlighet) og pbinom (kumulativ sannsynlighet) i R.
•Bruke feil parameter i pbinom: prob er sannsynligheten for suksess per forsok, IKKE andelen i utvalget.
•Glemme at binomisk fordeling krever uavhengighet mellom forsokene.
•Forveksle 'noyaktig k' med 'minst k' eller 'hoyest k'.
Normalfordeling
•Oppgi varians i stedet for standardavvik i pnorm/qnorm i R. R-funksjonen tar sd, ikke var!
•Glemme a standardisere for bruk av tabellen. Tabellen gjelder KUN for Z ~ N(0,1).
•Forveksle P(X > x) og P(X < x). Husk: lower.tail=FALSE gir hoyre hale.
•Blande 'sannsynlighet for at IQ er 115 eller mer' med 'sannsynlighet for at IQ er mellom 85 og 115'.
Sentralgrenseteoremet
•Bruke SGT for sma utvalg (n < 30) uten a vite at populasjonen er normalfordelt.
•Glemme at variansen til gjennomsnittet er sigma^2/n, ikke sigma^2.
•Forveksle sigma^2/n (varians til gjennomsnitt) med sigma^2 (varians til enkeltobservasjon).
•Glemme a nevne SGT som begrunnelse nar oppgaven ber deg 'vis at Z er tilnarmet standard normalfordelt'.
Estimatorteori
•Tro at forventningsrett betyr at estimatet alltid er lik theta. Det betyr at GJENNOMSNITTET av alle mulige estimater er theta.
•Glemme a argumentere for konsistens via Var -> 0 nar n -> uendelig.
•Forveksle effisiens (lav varians) med forventningsretthet (ingen bias).
•Glemme a skrive ut mellomregningen nar oppgaven ber deg 'vise at' -- det er selve beviset som gir poeng.
Kovarians og korrelasjon
•Konkludere at Cov(X,Y) = 0 betyr at X og Y er uavhengige. Det er FEIL -- kovarians maler kun lineaer sammenheng.
•Glemme kovarians-leddene i varians av lineaerkombinasjoner nar variablene er avhengige.
•Blande utvalgskovarians (n-1 i nevneren) med populasjonskovarians.
•Glemme at Cov(Z,Z) = Var(Z), ikke 0.
Konfidensintervall
•Bruke z nar sigma er ukjent. Nar sigma er ukjent bruker vi ALLTID t-fordeling.
•Feil frihetsgrader: df = n-1 for ett utvalg.
•Blande alpha og alpha/2. For tosidig KI er den kritiske verdien t_{alpha/2}, ikke t_{alpha}.
•Tolke KI feil: 'parameteren ligger i intervallet med 95% sannsynlighet' er FEIL. Riktig: 'metoden gir intervaller som dekker parameteren i 95% av tilfellene'.
Hypotesetesting
•Forveksle ensidig og tosidig test. Les oppgaveteksten noye for a avgjore retning pa H1.
•Bruke alpha i stedet for alpha/2 for tosidig test.
•Bruke feil nevner i testobservatoren: for andelstest brukes p0 (under H0), ikke p-hatt!
•Glemme a formulere H0 og H1 eksplisitt for du begynner a regne.
•Konkludere med a 'bekrefte H0'. Vi kan ALDRI bekrefte H0, bare 'ikke forkaste' den.
Regresjon
•Forveksle beta_1 (konstantledd) og beta_2 (stigning). beta_2 er effekten av X pa Y.
•Dele pa n-1 i stedet for n-2 i estimert varians for feilleddet. Vi har estimert TO parametre.
•Glemme a ta kvadratroten av hat{sigma}^2 nar man beregner SE. SE bruker hat{sigma}, ikke hat{sigma}^2.
•Tolke R^2 feil: R^2 = 0.18 betyr 18% forklart variasjon, IKKE at modellen er ubrukelig.
•Bruke R^2 direkte som korrelasjon. R^2 er KVADRATET av korrelasjonen.
R-programmering
•Blande pnorm/qnorm: pnorm gir sannsynlighet fra verdi, qnorm gir verdi fra sannsynlighet.
•Bruke sd i stedet for var, eller omvendt. sd(x) er sqrt(var(x)).
•Glemme correct=FALSE i prop.test. Standardinnstillingen bruker kontinuitetskorreksjon.
•Feil df i pt/qt: for t-test av gjennomsnitt er df = n-1, for regresjon er df = n-2.
•Forveksle lower.tail=TRUE (venstreside) og lower.tail=FALSE (hoyreside).
Eksamenstips
Deskriptiv statistikk
•R-funksjoner: mean(x), median(x), var(x) (gir s^2 med n-1), sd(x) (gir s med n-1).
•Nar oppgaven gir summer direkte (sum x_i, sum (x_i - xbar)^2), bruk dem rett i formlene.
•Kommenter alltid hva tallene betyr i kontekst (f.eks. 'gjennomsnittstemperaturen er 7.4 timer').
Sannsynlighet
•Sannsynlighetsoppgaver krever tydelig notasjon. Definer hendelsene eksplisitt for du regner.
•Tegn gjerne et Venn-diagram for a visualisere problemet.
•Oppgaver med disjunkte hendelser forenkler beregningene betraktelig. Se etter dette!
•Pa eksamen H2024 var det en hel oppgave (vekt 0.20) om sannsynlighetsregler med standard normalfordeling.
Binomisk fordeling
•dbinom = noyaktig k suksesser. pbinom = kumulativ (opptil k). Dette er en gjenganger pa R-oppgaven!
•Binomisk fordeling kobles ofte med normalfordeling: forst finn p via normalfordelingen, deretter bruk binomisk.
•Sjekk alltid om oppgaven spor om noyaktig, minst, eller hoyest -- dette bestemmer R-funksjonen.
Normalfordeling
•IQ-oppgaver med mu=100, sigma^2=225 er en gjenganger! Har kommet pa minst 3 av 5 eksamener.
•Pa R-oppgaven: sjekk alltid om oppgaven oppgir varians eller standardavvik -- R vil ha sd.
•For tabelloppslag: les Z-verdien til to desimaler. F.eks. Z=1.96 -> rad 1.9, kolonne 0.06.
Sentralgrenseteoremet
•Oppgaver som ber deg 'vis at Z er tilnarmet standard normalfordelt' krever at du eksplisitt refererer til SGT.
•Husk a angi betingelsene: uavhengighet og 'n er stor'.
•SGT-oppgaver har kommet pa 4 av 5 eksamener -- ofte som bevisoppgave (Oppgave 2). Les disse noye!
Estimatorteori
•Bevisoppgaver for E(S^2) = sigma^2 er en gjenganger (H2024). Ov pa a gjore dette beviset fra scratch.
•Nar oppgaven spor 'hva kan vi konkludere om de statistiske egenskapene', nevn forventningsretthet, konsistens og eventuelt effisiens.
•Oppgave 2 eller 3 pa eksamen er ofte en estimatorteori-oppgave med SGT. Vekt: 0.20-0.25.
Kovarians og korrelasjon
•Bevisoppgaver med Cov er en gjenganger -- spesielt med lineaerkombinasjoner av uavhengige Z-variabler.
•Skriv ut ALLE mellomtrinn. Vis tydelig hvilke regneregler du bruker.
•Husk: Cov(X, a) = 0 for alle konstanter a. Cov(X, X) = Var(X).
Konfidensintervall
•Alltid oppgi: punktestimat, kritisk verdi (og kilde), standardfeil, feilmargin, og det endelige intervallet.
•Kommenter resultatet i kontekst! F.eks. 'Intervallet inneholder fartsgrensen 100 km/t'.
•R-kode: qt(alpha/2, df, lower.tail=FALSE) for kritisk t-verdi. t.test(x, conf.level=0.90) for hele KI.
Hypotesetesting
•Foll ALLTID 5-trinns-malen: Hypoteser -> signifikansniva -> testobservator -> p-verdi/kritisk verdi -> konklusjon.
•I R: pt() for t-test p-verdier, pnorm() for z-test p-verdier. lower.tail avgjor retning.
•prop.test() for andeler, t.test() for gjennomsnitt. Alternative = 'greater', 'less', eller 'two.sided'.
•Hypotesetesting er pa HVER eksamen, typisk 0.10-0.25 av totalvekten. Denne oppgavetypen ma sitte!
Regresjon
•Regresjonsoppgaven er ALLTID den tyngste oppgaven (0.25-0.35 av eksamen). Start med denne om du er trygg.