eksamenssett
.no
Tren målrettet
Ungdomsskole/VGS
Høyskole
Ressurser
Skolenyttig
Forum
eksamenssett
.no
Tren målrettet
Ungdomsskole/VGS
Høyskole
Ressurser
Skolenyttig
Forum
eksamenssett
.no
Tren målrettet
Ungdomsskole/VGS
Høyskole
Ressurser
Skolenyttig
Forum
MET2
Cheat Sheet
Formler, begreper og oppsummering
Statistikk for økonomer
eksamenssett.no
Symboloversikt
Populasjon (greske bokstaver)
•
μ
\mu
μ
= populasjonsgjennomsnitt |
σ
\sigma
σ
= populasjonsstandardavvik |
σ
2
\sigma^2
σ
2
= populasjonsvarians
•
β
0
,
β
1
\beta_0, \beta_1
β
0
,
β
1
= sanne regresjonskoeffisienter |
ρ
\rho
ρ
= populasjonskorrelasjon |
ε
\varepsilon
ε
= feilledd
Utvalg (latinske bokstaver)
•
x
ˉ
\bar{x}
x
ˉ
= utvalgsgjennomsnitt |
s
s
s
= utvalgsstandardavvik |
s
2
s^2
s
2
= utvalgsvarians
•
β
^
0
,
β
^
1
\hat{\beta}_0, \hat{\beta}_1
β
^
0
,
β
^
1
= estimerte regresjonskoeffisienter |
r
r
r
= utvalgskorrelasjon |
e
i
e_i
e
i
= residual
Statistisk inferens
•
n
n
n
= utvalgsstørrelse |
α
\alpha
α
= signifikansnivå |
H
0
H_0
H
0
= nullhypotese |
H
1
H_1
H
1
= alternativ hypotese
•
t
t
t
= testobservator (t-test) |
z
z
z
= testobservator (z-test) |
p
p
p
-verdi = sannsynlighet for resultat minst like ekstremt
•
R
2
R^2
R
2
= forklaringsgrad |
R
ˉ
2
\bar{R}^2
R
ˉ
2
= justert
R
2
R^2
R
2
|
F
F
F
= F-testobservator
Formler
Deskriptiv statistikk
•
x
ˉ
=
1
n
∑
i
=
1
n
x
i
\displaystyle \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
x
ˉ
=
n
1
i
=
1
∑
n
x
i
(gjennomsnitt)
•
s
2
=
1
n
−
1
∑
(
x
i
−
x
ˉ
)
2
\displaystyle s^2 = \frac{1}{n-1}\sum(x_i - \bar{x})^2
s
2
=
n
−
1
1
∑
(
x
i
−
x
ˉ
)
2
(utvalgsvarians)
•
C
V
=
s
/
x
ˉ
⋅
100
%
CV = s/\bar{x} \cdot 100\,\%
C
V
=
s
/
x
ˉ
⋅
100
%
(variasjonskoeffisient)
•
I
Q
R
=
Q
3
−
Q
1
IQR = Q_3 - Q_1
I
QR
=
Q
3
−
Q
1
(kvartilbredde)
Sannsynlighetsregning
•
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
∩
B
)
P(A \cup B) = P(A) + P(B) - P(A \cap B)
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
∩
B
)
•
P
(
A
∣
B
)
=
P
(
A
∩
B
)
/
P
(
B
)
P(A|B) = P(A \cap B)/P(B)
P
(
A
∣
B
)
=
P
(
A
∩
B
)
/
P
(
B
)
•
Bayes:
P
(
B
j
∣
A
)
=
P
(
A
∣
B
j
)
P
(
B
j
)
∑
P
(
A
∣
B
i
)
P
(
B
i
)
\displaystyle P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum P(A|B_i)P(B_i)}
P
(
B
j
∣
A
)
=
∑
P
(
A
∣
B
i
)
P
(
B
i
)
P
(
A
∣
B
j
)
P
(
B
j
)
•
Uavhengighet:
P
(
A
∩
B
)
=
P
(
A
)
⋅
P
(
B
)
P(A \cap B) = P(A) \cdot P(B)
P
(
A
∩
B
)
=
P
(
A
)
⋅
P
(
B
)
Sannsynlighetsfordelinger
•
Binomisk:
P
(
X
=
k
)
=
(
n
k
)
p
k
(
1
−
p
)
n
−
k
P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}
P
(
X
=
k
)
=
(
k
n
)
p
k
(
1
−
p
)
n
−
k
,
E
=
n
p
E = np
E
=
n
p
,
Var
=
n
p
(
1
−
p
)
\text{Var} = np(1-p)
Var
=
n
p
(
1
−
p
)
•
Poisson:
P
(
X
=
k
)
=
λ
k
e
−
λ
/
k
!
P(X=k) = \lambda^k e^{-\lambda}/k!
P
(
X
=
k
)
=
λ
k
e
−
λ
/
k
!
,
E
=
Var
=
λ
E = \text{Var} = \lambda
E
=
Var
=
λ
•
Normal:
Z
=
(
X
−
μ
)
/
σ
Z = (X - \mu)/\sigma
Z
=
(
X
−
μ
)
/
σ
•
E
(
a
X
+
b
)
=
a
E
(
X
)
+
b
E(aX+b) = aE(X)+b
E
(
a
X
+
b
)
=
a
E
(
X
)
+
b
,
Var
(
a
X
+
b
)
=
a
2
Var
(
X
)
\text{Var}(aX+b) = a^2\text{Var}(X)
Var
(
a
X
+
b
)
=
a
2
Var
(
X
)
Estimering og konfidensintervall
•
S
E
(
X
ˉ
)
=
s
/
n
SE(\bar{X}) = s/\sqrt{n}
SE
(
X
ˉ
)
=
s
/
n
(standardfeil)
•
z-intervall:
x
ˉ
±
z
α
/
2
⋅
σ
/
n
\bar{x} \pm z_{\alpha/2} \cdot \sigma/\sqrt{n}
x
ˉ
±
z
α
/2
⋅
σ
/
n
•
t-intervall:
x
ˉ
±
t
α
/
2
,
n
−
1
⋅
s
/
n
\bar{x} \pm t_{\alpha/2,n-1} \cdot s/\sqrt{n}
x
ˉ
±
t
α
/2
,
n
−
1
⋅
s
/
n
•
Proporsjon:
p
^
±
z
α
/
2
p
^
(
1
−
p
^
)
/
n
\hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}
p
^
±
z
α
/2
p
^
(
1
−
p
^
)
/
n
•
Utvalgsstørrelse:
n
=
(
z
α
/
2
⋅
σ
/
E
)
2
n = (z_{\alpha/2} \cdot \sigma / E)^2
n
=
(
z
α
/2
⋅
σ
/
E
)
2
Hypotesetesting
•
t-test:
t
=
(
x
ˉ
−
μ
0
)
/
(
s
/
n
)
t = (\bar{x} - \mu_0)/(s/\sqrt{n})
t
=
(
x
ˉ
−
μ
0
)
/
(
s
/
n
)
,
d
f
=
n
−
1
df = n-1
df
=
n
−
1
•
z-test proporsjon:
z
=
(
p
^
−
p
0
)
/
p
0
(
1
−
p
0
)
/
n
z = (\hat{p}-p_0)/\sqrt{p_0(1-p_0)/n}
z
=
(
p
^
−
p
0
)
/
p
0
(
1
−
p
0
)
/
n
•
Forkast
H
0
H_0
H
0
hvis
p
p
p
-verdi
≤
α
\le \alpha
≤
α
•
Type I =
α
\alpha
α
, type II =
β
\beta
β
, styrke =
1
−
β
1-\beta
1
−
β
Regresjon
•
β
^
1
=
S
X
Y
/
S
X
X
\hat{\beta}_1 = S_{XY}/S_{XX}
β
^
1
=
S
X
Y
/
S
XX
,
β
^
0
=
Y
ˉ
−
β
^
1
X
ˉ
\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}
β
^
0
=
Y
ˉ
−
β
^
1
X
ˉ
•
R
2
=
1
−
S
S
E
/
S
S
T
=
S
S
R
/
S
S
T
R^2 = 1 - SSE/SST = SSR/SST
R
2
=
1
−
SSE
/
SST
=
SSR
/
SST
•
R
ˉ
2
=
1
−
(
1
−
R
2
)
(
n
−
1
)
/
(
n
−
k
−
1
)
\bar{R}^2 = 1 - (1-R^2)(n-1)/(n-k-1)
R
ˉ
2
=
1
−
(
1
−
R
2
)
(
n
−
1
)
/
(
n
−
k
−
1
)
•
F-test:
F
=
M
S
R
/
M
S
E
F = MSR/MSE
F
=
MSR
/
MSE
,
d
f
1
=
k
df_1 = k
d
f
1
=
k
,
d
f
2
=
n
−
k
−
1
df_2 = n-k-1
d
f
2
=
n
−
k
−
1
•
t-test:
t
=
β
^
j
/
S
E
(
β
^
j
)
t = \hat{\beta}_j/SE(\hat{\beta}_j)
t
=
β
^
j
/
SE
(
β
^
j
)
•
s
e
=
S
S
E
/
(
n
−
k
−
1
)
s_e = \sqrt{SSE/(n-k-1)}
s
e
=
SSE
/
(
n
−
k
−
1
)
Modelldiagnostikk
•
Durbin-Watson:
D
W
≈
2
DW \approx 2
D
W
≈
2
= ingen autokorrelasjon
•
VIF
j
=
1
/
(
1
−
R
j
2
)
_j = 1/(1-R_j^2)
j
=
1/
(
1
−
R
j
2
)
, VIF
>
10
> 10
>
10
= problem
•
Cooks avstand:
D
i
>
1
D_i > 1
D
i
>
1
= innflytelsesrik
•
AIC/BIC: lavere = bedre modell
Nøkkelformler per tema
Deskriptiv statistikk
•
x
ˉ
=
1
n
∑
x
i
\displaystyle \bar{x} = \frac{1}{n}\sum x_i
x
ˉ
=
n
1
∑
x
i
•
s
2
=
1
n
−
1
∑
(
x
i
−
x
ˉ
)
2
\displaystyle s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2
s
2
=
n
−
1
1
∑
(
x
i
−
x
ˉ
)
2
•
C
V
=
s
x
ˉ
⋅
100
%
\displaystyle CV = \frac{s}{\bar{x}} \cdot 100\,\%
C
V
=
x
ˉ
s
⋅
100
%
•
I
Q
R
=
Q
3
−
Q
1
IQR = Q_3 - Q_1
I
QR
=
Q
3
−
Q
1
Sannsynlighetsregning
•
P
(
A
∣
B
)
=
P
(
A
∩
B
)
P
(
B
)
\displaystyle P(A|B) = \frac{P(A \cap B)}{P(B)}
P
(
A
∣
B
)
=
P
(
B
)
P
(
A
∩
B
)
•
P
(
A
∩
B
)
=
P
(
A
)
⋅
P
(
B
)
P(A \cap B) = P(A) \cdot P(B)
P
(
A
∩
B
)
=
P
(
A
)
⋅
P
(
B
)
(uavhengige)
•
Bayes:
P
(
B
j
∣
A
)
=
P
(
A
∣
B
j
)
P
(
B
j
)
∑
P
(
A
∣
B
i
)
P
(
B
i
)
\displaystyle P(B_j|A) = \frac{P(A|B_j) P(B_j)}{\sum P(A|B_i) P(B_i)}
P
(
B
j
∣
A
)
=
∑
P
(
A
∣
B
i
)
P
(
B
i
)
P
(
A
∣
B
j
)
P
(
B
j
)
Sannsynlighetsfordelinger
•
Binomisk:
P
(
X
=
k
)
=
(
n
k
)
p
k
(
1
−
p
)
n
−
k
P(X=k) = \binom{n}{k} p^k(1-p)^{n-k}
P
(
X
=
k
)
=
(
k
n
)
p
k
(
1
−
p
)
n
−
k
,
E
(
X
)
=
n
p
E(X) = np
E
(
X
)
=
n
p
•
Poisson:
P
(
X
=
k
)
=
λ
k
e
−
λ
k
!
\displaystyle P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
P
(
X
=
k
)
=
k
!
λ
k
e
−
λ
,
E
(
X
)
=
Var
(
X
)
=
λ
E(X) = \text{Var}(X) = \lambda
E
(
X
)
=
Var
(
X
)
=
λ
•
Normal:
Z
=
X
−
μ
σ
\displaystyle Z = \frac{X-\mu}{\sigma}
Z
=
σ
X
−
μ
, 68-95-99,7-regel
Estimering og konfidensintervall
•
S
E
(
X
ˉ
)
=
s
n
\displaystyle SE(\bar{X}) = \frac{s}{\sqrt{n}}
SE
(
X
ˉ
)
=
n
s
•
z-intervall:
x
ˉ
±
z
α
/
2
⋅
σ
n
\displaystyle \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}
x
ˉ
±
z
α
/2
⋅
n
σ
•
t-intervall:
x
ˉ
±
t
α
/
2
,
n
−
1
⋅
s
n
\displaystyle \bar{x} \pm t_{\alpha/2,\,n-1} \cdot \frac{s}{\sqrt{n}}
x
ˉ
±
t
α
/2
,
n
−
1
⋅
n
s
•
Proporsjon:
p
^
±
z
α
/
2
p
^
(
1
−
p
^
)
n
\displaystyle \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
p
^
±
z
α
/2
n
p
^
(
1
−
p
^
)
Hypotesetesting
•
t-test:
t
=
x
ˉ
−
μ
0
s
/
n
\displaystyle t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}
t
=
s
/
n
x
ˉ
−
μ
0
,
d
f
=
n
−
1
df = n-1
df
=
n
−
1
•
z-test proporsjon:
z
=
p
^
−
p
0
p
0
(
1
−
p
0
)
/
n
\displaystyle z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}
z
=
p
0
(
1
−
p
0
)
/
n
p
^
−
p
0
•
Type I feil =
α
\alpha
α
, type II feil =
β
\beta
β
, styrke =
1
−
β
1-\beta
1
−
β
Enkel lineær regresjon
•
β
^
1
=
S
X
Y
S
X
X
\displaystyle \hat{\beta}_1 = \frac{S_{XY}}{S_{XX}}
β
^
1
=
S
XX
S
X
Y
,
β
^
0
=
Y
ˉ
−
β
^
1
X
ˉ
\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}
β
^
0
=
Y
ˉ
−
β
^
1
X
ˉ
•
R
2
=
1
−
S
S
E
S
S
T
\displaystyle R^2 = 1 - \frac{SSE}{SST}
R
2
=
1
−
SST
SSE
•
t-test:
t
=
β
^
1
S
E
(
β
^
1
)
\displaystyle t = \frac{\hat{\beta}_1}{SE(\hat{\beta}_1)}
t
=
SE
(
β
^
1
)
β
^
1
,
d
f
=
n
−
2
df = n-2
df
=
n
−
2
•
s
e
=
S
S
E
/
(
n
−
2
)
s_e = \sqrt{SSE/(n-2)}
s
e
=
SSE
/
(
n
−
2
)
Multippel regresjon
•
R
ˉ
2
=
1
−
(
1
−
R
2
)
n
−
1
n
−
k
−
1
\displaystyle \bar{R}^2 = 1 - (1-R^2)\frac{n-1}{n-k-1}
R
ˉ
2
=
1
−
(
1
−
R
2
)
n
−
k
−
1
n
−
1
•
F-test:
F
=
M
S
R
M
S
E
\displaystyle F = \frac{MSR}{MSE}
F
=
MSE
MSR
,
d
f
1
=
k
df_1 = k
d
f
1
=
k
,
d
f
2
=
n
−
k
−
1
df_2 = n-k-1
d
f
2
=
n
−
k
−
1
•
t-test:
t
=
β
^
j
S
E
(
β
^
j
)
\displaystyle t = \frac{\hat{\beta}_j}{SE(\hat{\beta}_j)}
t
=
SE
(
β
^
j
)
β
^
j
,
d
f
=
n
−
k
−
1
df = n-k-1
df
=
n
−
k
−
1
•
VIF
j
=
1
1
−
R
j
2
\displaystyle _j = \frac{1}{1 - R_j^2}
j
=
1
−
R
j
2
1
Modelldiagnostikk
•
Durbin-Watson:
D
W
=
∑
(
e
i
−
e
i
−
1
)
2
∑
e
i
2
\displaystyle DW = \frac{\sum(e_i - e_{i-1})^2}{\sum e_i^2}
D
W
=
∑
e
i
2
∑
(
e
i
−
e
i
−
1
)
2
, ideelt
≈
2
\approx 2
≈
2
•
VIF
>
10
> 10
>
10
= alvorlig multikollinearitet
•
Modellvalg:
R
ˉ
2
\bar{R}^2
R
ˉ
2
(maks), AIC/BIC (min)
Vanlige feil å unngå
Deskriptiv statistikk
•
Deler på
n
n
n
i stedet for
n
−
1
n-1
n
−
1
i utvalgsvariansen — husk at Bessel-korreksjonen (
n
−
1
n-1
n
−
1
) gir forventningsrett estimat.
•
Forveksler standardavvik og varians — standardavviket er i samme enhet som dataene, variansen er i kvadrerte enheter.
•
Bruker gjennomsnitt som sentralmål for skjeve fordelinger — medianen er mer robust ved skjevhet og ekstremverdier.
•
Glemmer at variasjonskoeffisienten kun gir mening for data med naturlig nullpunkt (forholdstallsskala).
Sannsynlighetsregning
•
Glemmer å trekke fra snittet i addisjonsloven —
P
(
A
∪
B
)
≠
P
(
A
)
+
P
(
B
)
P(A \cup B) \neq P(A) + P(B)
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
med mindre hendelsene er gjensidig utelukkende.
•
Forveksler uavhengighet og gjensidig utelukkende — gjensidig utelukkende hendelser er IKKE uavhengige (tvert imot).
•
Forveksler
P
(
A
∣
B
)
P(A|B)
P
(
A
∣
B
)
og
P
(
B
∣
A
)
P(B|A)
P
(
B
∣
A
)
— dette er generelt svært forskjellige sannsynligheter.
•
Bruker feil nevner i Bayes — husk at nevneren er totalsannsynligheten
P
(
A
)
P(A)
P
(
A
)
beregnet med totallovsetningen.
Sannsynlighetsfordelinger
•
Forveksler
σ
2
\sigma^2
σ
2
(varians) og
σ
\sigma
σ
(standardavvik) i normalfordelingen —
N
(
μ
,
σ
2
)
N(\mu, \sigma^2)
N
(
μ
,
σ
2
)
bruker variansen som parameter.
•
Glemmer å standardisere til
Z
Z
Z
før bruk av normaltabellen.
•
Bruker binomisk fordeling når forsøkene ikke er uavhengige (f.eks. trekking uten tilbakelegging med liten populasjon).
•
Glemmer
Var
(
a
X
)
=
a
2
Var
(
X
)
\text{Var}(aX) = a^2\text{Var}(X)
Var
(
a
X
)
=
a
2
Var
(
X
)
— det er
a
2
a^2
a
2
, ikke
a
a
a
.
Estimering og konfidensintervall
•
Bruker z-verdier når
σ
\sigma
σ
er ukjent — bruk t-fordeling med
n
−
1
n-1
n
−
1
frihetsgrader.
•
Tolker 95 % KI feil: det betyr IKKE at det er 95 % sannsynlighet for at
μ
\mu
μ
ligger i intervallet. Det betyr at 95 % av slike intervaller vil dekke
μ
\mu
μ
.
•
Glemmer at dobling av presisjon krever fire ganger så stort utvalg (
n
n
n
er omvendt proporsjonal med
E
2
E^2
E
2
).
•
Bruker feil formel for proporsjon vs. gjennomsnitt.
Hypotesetesting
•
Bruker
p
^
\hat{p}
p
^
i stedet for
p
0
p_0
p
0
i nevneren ved z-test for proporsjon — under
H
0
H_0
H
0
bruker vi alltid
p
0
p_0
p
0
.
•
Sier at vi «aksepterer»
H
0
H_0
H
0
— korrekt formulering er «kan ikke forkaste
H
0
H_0
H
0
» eller «det er ikke tilstrekkelig bevis».
•
Glemmer å doble p-verdien ved tosidig test — p-verdien fra tabellen for én hale må ganges med 2.
•
Forveksler statistisk signifikans med praktisk betydning — en stor
n
n
n
kan gi signifikant resultat selv for minimale forskjeller.
Enkel lineær regresjon
•
Tolker
β
^
0
\hat{\beta}_0
β
^
0
kausalt uten å vurdere om
X
=
0
X = 0
X
=
0
er meningsfullt i konteksten.
•
Forveksler
R
2
R^2
R
2
og korrelasjon — i enkel regresjon er
R
2
=
r
2
R^2 = r^2
R
2
=
r
2
, men dette gjelder ikke i multippel regresjon.
•
Bruker feil frihetsgrader (
n
−
1
n-1
n
−
1
i stedet for
n
−
2
n-2
n
−
2
) — enkel regresjon estimerer to parametere, derav
n
−
2
n-2
n
−
2
.
•
Ekstrapolerer langt utenfor dataområdet — regresjonsmodellen er kun pålitelig innenfor observerte
X
X
X
-verdier.
Multippel regresjon
•
Tolker
β
^
j
\hat{\beta}_j
β
^
j
uten «kontrollert for»-presiseringen — i multippel regresjon er koeffisienten en partiell effekt.
•
Bruker
R
2
R^2
R
2
i stedet for
R
ˉ
2
\bar{R}^2
R
ˉ
2
til modellsammenligning —
R
2
R^2
R
2
øker alltid med flere variabler,
R
ˉ
2
\bar{R}^2
R
ˉ
2
kan synke.
•
Inkluderer alle
m
m
m
dummyer for en kategorisk variabel med
m
m
m
kategorier — det gir perfekt multikollinearitet (dummy-fellen).
•
Forveksler individuell t-test og samlet F-test — F-test kan forkaste mens alle t-tester beholder
H
0
H_0
H
0
(multikollinearitet).
Modelldiagnostikk
•
Ignorerer residualanalyse — en modell med høy
R
2
R^2
R
2
kan likevel bryte viktige forutsetninger.
•
Forveksler heteroskedastisitet og autokorrelasjon — heteroskedastisitet er ikke-konstant varians, autokorrelasjon er korrelasjon mellom feilledd.
•
Tror at brudd på forutsetningene gjør OLS-estimatene forventningsskjeve — de er fortsatt forventningsrette, men standardfeilene blir feil.
•
Fjerner uteliggere automatisk uten faglig begrunnelse — alltid vurder om det er en logisk grunn til å fjerne.
Eksamenstips
Deskriptiv statistikk
•
Skriv alltid ned formelen du bruker FØR du setter inn tall — det gir poeng selv om svaret blir feil.
•
Vis mellomregning i variansberegninger: skriv ut alle
(
x
i
−
x
ˉ
)
2
(x_i - \bar{x})^2
(
x
i
−
x
ˉ
)
2
-leddene.
•
Vurder alltid om medianen er bedre enn gjennomsnittet som sentralmål — kommenter skjevhet og ekstremverdier.
Sannsynlighetsregning
•
Tegn alltid et Venn-diagram eller trediagram for å visualisere problemet.
•
Definer hendelsene tydelig med bokstaver og skriv ned de oppgitte sannsynlighetene FØR du regner.
•
I Bayes-oppgaver: identifiser alltid hva som er «gitt» (betingelsen) og hva du skal finne.
Sannsynlighetsfordelinger
•
Identifiser alltid fordelingstype først: er variabelen diskret eller kontinuerlig? Er det telling (binomisk/Poisson) eller måling (normal)?
•
Skriv alltid
X
∼
Fordeling
(
parametere
)
X \sim \text{Fordeling}(\text{parametere})
X
∼
Fordeling
(
parametere
)
før du begynner å regne.
•
For normalfordelingen: tegn en skisse med det skraverte arealet du skal finne — det forhindrer fortegnsfeil.
Estimering og konfidensintervall
•
Sjekk alltid forutsetningene: er
σ
\sigma
σ
kjent/ukjent? Er
n
n
n
stor nok for SGT? Er fordelingen normalfordelt?
•
Vis tydelig hvilken tabell og kritisk verdi du bruker (z vs. t) og oppgi frihetsgrader for t.
•
Avrund feilmarginen til passende antall desimaler, og presenter KI tydelig som et intervall
(
a
;
b
)
(a;\; b)
(
a
;
b
)
.
Hypotesetesting
•
Følg ALLTID de fem stegene eksplisitt — sensor gir poeng for hvert steg.
•
Skriv en konklusjon i kontekst, ikke bare «forkast
H
0
H_0
H
0
» — forklar hva det betyr i oppgavens sammenheng.
•
Oppgi alltid frihetsgrader og den kritiske verdien/p-verdien du bruker.
Enkel lineær regresjon
•
Tolk ALLTID koeffisientene i kontekst: «Når
X
X
X
øker med 1 enhet, endres
Y
Y
Y
med
β
^
1
\hat{\beta}_1
β
^
1
enheter.»
•
Kommenter
R
2
R^2
R
2
— er forklaringsgraden god nok? Hva forklarer de resterende prosentene?
•
Husk at signifikant
β
1
≠
0
\beta_1 \neq 0
β
1
=
0
ikke nødvendigvis betyr kausal sammenheng — korrelasjon er ikke kausalitet.
Multippel regresjon
•
Tolk alltid koeffisienter med «kontrollert for de andre variablene» — dette er hele poenget med multippel regresjon.
•
Ved modellsammenligning: bruk
R
ˉ
2
\bar{R}^2
R
ˉ
2
(justert) og F-test, ikke bare
R
2
R^2
R
2
.
•
Kommenter eventuelle VIF-verdier og multikollinearitetsproblemer dersom informasjon er gitt.
Modelldiagnostikk
•
Beskriv systematisk hva du ser i residualplottet: form, spredning, eventuelle mønstre.
•
Kommenter Durbin-Watson-verdien i kontekst: «
D
W
=
1,5
DW = 1{,}5
D
W
=
1
,
5
, noe som kan indikere positiv autokorrelasjon.»
•
Foreslå konkrete tiltak ved brudd: White-robuste standardfeil ved heteroskedastisitet, logtransformasjon, eller inkludering av utelatte variabler.
MET2 Formelark | Eksamenssett