STK1100

Cheat Sheet

Formler, begreper og oppsummering

Sannsynlighet og statistiske metoder

eksamenssett.no

Formler

Sannsynlighetsregning

• $P(A|B) = \frac{P(A \cap B)}{P(B)}$ (Betinget sannsynlighet)
• $P(A) = \sum_i P(A|B_i) P(B_i)$ (Total sannsynlighet)
• $P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum_i P(A|B_i)P(B_i)}$ (Bayes' formel)

Diskrete fordelinger

•Poisson: $P(X=x) = \frac{\lambda^x}{x!}e^{-\lambda}$ , $E(X) = V(X) = \lambda$
•Poisson MGF: $M_X(t) = e^{\lambda(e^t - 1)}$
•Sum av uavhengige Poisson: $\text{Pois}(\lambda_1) + \text{Pois}(\lambda_2) = \text{Pois}(\lambda_1 + \lambda_2)$

Kontinuerlige fordelinger

•Eksponensial: $f(x) = \frac{1}{\mu}e^{-x/\mu}$ , $E(X)=\mu$ , $V(X)=\mu^2$ , $M_X(t) = \frac{1}{1-t\mu}$
•Gamma: $f(x) = \frac{x^{\alpha-1}}{\beta^\alpha \Gamma(\alpha)}e^{-x/\beta}$ , $E(X)=\alpha\beta$ , $V(X)=\alpha\beta^2$
•Normal: $f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$
• $\chi^2_n = \text{Gamma}(n/2, 2)$
•Laplace: $f(x) = \frac{1}{2\sigma}e^{-|x|/\sigma}$ , $E(|X|) = \sigma$ , $V(|X|) = \sigma^2$

Estimering

• $L(\theta) = \prod f(x_i; \theta)$ , $\ell(\theta) = \sum \ln f(x_i; \theta)$
•MLE: $\frac{d\ell}{d\theta} = 0$
•Poisson MLE: $\hat{\lambda} = \bar{X}$
•Eksponensial MLE: $\hat{\mu} = \bar{X}$
• $V(\bar{X}) = \sigma^2 / n$ (Varians til gjennomsnittet)

Sentralgrenseteoremet og konfidensintervaller

• $\bar{X} \approx N(\mu, \sigma^2/n)$ for stor $n$
•Standard KI: $\hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$
• $z_{0.025} = 1.960$ , $z_{0.05} = 1.645$ , $z_{0.005} = 2.576$

Lineaer regresjon

• $\hat{\beta}_1 = \frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2}$ , $\hat{\beta}_0 = \bar{y} - \hat{\beta}_1\bar{x}$
• $\hat{\gamma}_1 = \frac{\sum x_iy_i}{\sum x_i^2}$ (uten konstantledd)
• $V(\hat{\beta}_1) = \frac{\sigma^2}{\sum(x_i-\bar{x})^2}$
• $V(\hat{\gamma}_1) = \frac{\sigma^2}{\sum x_i^2}$

Median, transformasjon og Poissonprosess

•Median: $F_X(\tilde{\mu}) = \tfrac{1}{2}$
•Transformasjon (2D): $f_{U,V}(u,v) = f_{X,Y}(x,y)\,|\det J|$
•Poissonprosess: $X(t) \sim \text{Pois}(\alpha t)$ , ventetid $T \sim \text{Exp}(\alpha)$ , $P(T>t)=e^{-\alpha t}$
•Minneloeshet: $P(T > s+t \mid T > s) = P(T > t)$

Bootstrap

•Bootstrap-standardfeil: $\hat{\sigma}_{\hat{\theta}} = \sqrt{\frac{1}{B-1}\sum_{b=1}^B (\hat{\theta}^*_b - \bar{\hat{\theta}}^*)^2}$
•Ikke-parametrisk: trekk med tilbakelegging fra data
•Parametrisk: trekk fra modell med $\hat{\theta}$ innsatt

Nyttige integraler

• $\int_0^\infty x^{a-1} e^{-x/b} \, dx = b^a \Gamma(a)$
• $\Gamma(a) = (a-1)!$ for heltall $a$
• $\Gamma(1/2) = \sqrt{\pi}$

Nøkkelformler per tema

Sannsynlighetsregning og Bayes' formel

• $P(A \mid B) = \frac{P(A \cap B)}{P(B)}$ (Betinget sannsynlighet)
• $P(A) = \sum_{i} P(A \mid B_i) P(B_i)$ (Total sannsynlighet)
• $P(B_j \mid A) = \frac{P(A \mid B_j) P(B_j)}{\sum_i P(A \mid B_i) P(B_i)}$ (Bayes' formel)
• $P(A^c) = 1 - P(A)$ (Komplementregelen)

Diskrete fordelinger (Poisson)

• $P(X = x) = \frac{\lambda^x}{x!} e^{-\lambda}$ (Poisson punktsannsynlighet)
• $E(X) = V(X) = \lambda$ (Forventning = Varians)
• $M_X(t) = e^{\lambda(e^t - 1)}$ (Momentgenererende funksjon)
• $X_1 + X_2 \sim \text{Pois}(\lambda_1 + \lambda_2)$ (Sum av uavhengige Poisson)
• $X \sim \text{Pois}(\lambda v_0)$ når raten er $\lambda$ per enhet over $v_0$ enheter

Kontinuerlige fordelinger

• $f_X(x) = \frac{1}{\mu} e^{-x/\mu}$ for $x > 0$ (Eksponensialfordeling)
• $E(X) = \mu, \quad V(X) = \mu^2, \quad M_X(t) = \frac{1}{1-t\mu}$ (Eksponensial)
• $f_X(x) = \frac{x^{\alpha-1}}{\beta^\alpha \Gamma(\alpha)} e^{-x/\beta}$ (Gammafordeling)
• $\text{Gamma}(n/2, 2) = \chi^2_n$ (Kjikvadrat = spesialtilfelle av gamma)
• $\sum X_i \sim \text{Gamma}(\sum \alpha_i, \beta)$ for uavhengige med samme $\beta$

Simultanfordelinger og marginalfordelinger

• $f_X(x) = \int f(x,y) \, dy$ (Marginaltetthet)
• $f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)}$ (Betinget tetthet)
•Uavhengighet: $f(x,y) = f_X(x) \cdot f_Y(y)$ for alle $(x,y)$
• $F_Y(y) = \int_{-\infty}^{y} f_Y(t) \, dt$ (Kumulativ fordeling)
• $P(Y \geq X) = \iint_{y \geq x} f(x,y) \, dx \, dy$ (Sannsynlighet over region)

Maksimum likelihood-estimering (MLE)

• $L(\theta) = \prod_{i=1}^n f(x_i; \theta)$ (Likelihood-funksjonen)
• $\ell(\theta) = \sum_{i=1}^n \ln f(x_i; \theta)$ (Log-likelihood)
• $\frac{d\ell}{d\theta} = 0$ (Likelihoodligningen)

Egenskaper ved estimatorer

• $E(\hat{\theta}) = \theta$ (Forventningsretthet)
• $\text{SE}(\hat{\theta}) = \sqrt{V(\hat{\theta})}$ (Standardfeil)
• $V(aX + b) = a^2 V(X)$ (Variansregel for lineaer transformasjon)
• $V\left(\sum X_i\right) = \sum V(X_i)$ (for uavhengige variabler)

Sentralgrenseteoremet og normalapproksimasjon

• $\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)$ for stor $n$ (SGT)
• $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \approx N(0,1)$ (Standardisering)
• $Z' = \frac{\hat{\theta} - \theta}{\widehat{\text{SE}}(\hat{\theta})} \approx N(0,1)$ (Slutsky / plug-in)

Konfidensintervaller

• $\hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$ (Standard normalbasert KI)
• $\left[\frac{2n\hat{\mu}}{\chi^2_{2n, \alpha/2}}, \, \frac{2n\hat{\mu}}{\chi^2_{2n, 1-\alpha/2}}\right]$ (Kjikvadratbasert KI for $\mu$)
• $\left[\frac{n\hat{\sigma}^2}{\chi^2_{n, \alpha/2}}, \, \frac{n\hat{\sigma}^2}{\chi^2_{n, 1-\alpha/2}}\right]$ (KI for $\sigma^2$)
• $z_{0.025} = 1.960, \quad z_{0.05} = 1.645, \quad z_{0.005} = 2.576$ (Kritiske verdier)

Lineaer regresjon

• $\hat{\beta}_1 = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sum(x_i - \bar{x})^2}$ (MKM stigningstall)
• $\hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x}$ (MKM konstantledd)
• $\hat{\gamma}_1 = \frac{\sum x_i y_i}{\sum x_i^2}$ (MKM uten konstantledd)
• $V(\hat{\beta}_1) = \frac{\sigma^2}{\sum(x_i - \bar{x})^2}$ (Varians til stigningstall)
• $V(\hat{\gamma}_1) = \frac{\sigma^2}{\sum x_i^2}$ (Varians uten konstantledd)

Median, kvantiler og transformasjon av variabler

• $F_X(\tilde{\mu}) = \tfrac{1}{2}$ (Medianligningen)
• $f_Y(y) = \frac{d}{dy} F_Y(y) = \frac{d}{dy} P(g(X) \le y)$ (CDF-metoden, en variabel)
• $f_{U,V}(u,v) = f_{X,Y}(x(u,v), y(u,v)) \, |\det J|$ (Jacobi-metoden)
• $|\det J| = \left| \frac{\partial x}{\partial u}\frac{\partial y}{\partial v} - \frac{\partial x}{\partial v}\frac{\partial y}{\partial u} \right|$ (Jacobi-determinant, 2D)

Bootstrap og simulering

• $\hat{\sigma}_{\hat{\theta}} = \sqrt{\frac{1}{B-1}\sum_{b=1}^B (\hat{\theta}^*_b - \bar{\hat{\theta}}^*)^2}$ (Bootstrap-standardfeil)
•Ikke-parametrisk: trekk $x_1^*, \ldots, x_n^*$ med tilbakelegging fra dataene
•Parametrisk: trekk $x_1^*, \ldots, x_n^*$ fra modellen med $\hat{\theta}$ satt inn
•Dekningsgrad: andelen av simulerte konfidensintervaller som inneholder sann $\theta$

Poissonprosess og ventetider

• $X(t) \sim \text{Pois}(\alpha t)$ (Antall hendelser i intervall av lengde t)
• $P(T > t) = e^{-\alpha t}, \quad f_T(t) = \alpha e^{-\alpha t}$ (Ventetid til første hendelse)
• $P(T > s+t \mid T > s) = P(T > t)$ (Minneloeshet)
•Tid til r-te hendelse: $\sim \text{gamma}(r, 1/\alpha)$ , forventning $r/\alpha$

Vanlige feil å unngå

Sannsynlighetsregning og Bayes' formel

•Forveksle P(A|B) og P(B|A) -- de er generelt IKKE like. Bayes' formel snur rekkefølgen.
•Glemme å bruke total sannsynlighet i nevneren til Bayes' formel.
•I itererte Bayes-oppgaver: bruke den opprinnelige prior i stedet for den oppdaterte posterior.
•Blande disjunkte og uavhengige hendelser. Disjunkte hendelser med positiv sannsynlighet er alltid avhengige.

Diskrete fordelinger (Poisson)

•Glemme at Poisson krever E(X) = V(X). Sjekk alltid dette for å vurdere modellens gyldighet.
•Forveksle rateparameteren lambda (per enhet) med den totale parameteren lambda*v0.
•Ved bruk av MGF: glemme å evaluere i t = 0 etter derivering.
•Blande P(X >= 1) = 1 - P(X = 0) med P(X > 1) = 1 - P(X = 0) - P(X = 1).

Kontinuerlige fordelinger

•Forveksle parametriseringen av eksponensialfordelingen: noen bruker rate 1/mu, andre bruker forventning mu. STK1100 bruker mu som forventning.
•Glemme at gamma-summeegenskapen kun gjelder når skalaparameteren beta er lik.
•Ved transformasjonsformelen: glemme å ta absoluttverdien av Jacobi-determinanten.
•Forveksle Gamma(1/2, 2) med Gamma(2, 1/2) -- skriv alltid (formparameter, skalaparameter).

Simultanfordelinger og marginalfordelinger

•Sette feil integrasjonsgrenser når man integrerer ut en variabel. Tegn alltid omradet!
•Konkludere med uavhengighet bare fordi man ser et produkt -- sjekk at faktorene kun avhenger av en variabel hver.
•Glemme at betinget tetthet er udefinert når f_X(x) = 0.
•Beregne P(Y >= X) med feil integrasjonsomrade. Tegn omradet i xy-planet først.

Maksimum likelihood-estimering (MLE)

•Glemme å ta logaritmen av likelihood-funksjonen for derivering -- det er mye enklere a jobbe med log-likelihood.
•Derivere log-likelihood feil, særlig med absoluttverdier som i Laplace-fordelingen.
•Anta at MLE og momentestimator alltid er like -- det gjelder for eksponensialfamilien, men ikke generelt.
•Glemme å sjekke at løsningen gir et maksimum, ikke et minimum (andrederivert-test).

Egenskaper ved estimatorer

•Glemme at V(X1 + X2) = V(X1) + V(X2) kun gjelder for UAVHENGIGE variabler.
•Blande varians og standardfeil -- standardfeil er kvadratroten av variansen.
•Glemme å kvadrere konstanten foran i variansregelen: V(aX) = a^2 V(X), IKKE a V(X).
•Plugge inn estimatet i standardfeilen uten å nevne at det er en estimert standardfeil.

Sentralgrenseteoremet og normalapproksimasjon

•Bruke SGT når n er for liten (f.eks. n = 5). Argumenter alltid for at n er 'tilstrekkelig stor'.
•Glemme å nevne SGT eksplisitt -- skriv 'ved sentralgrenseteoremet' når du bruker det.
•Forveksle sigma/sqrt(n) (standardfeil) med sigma (standardavvik). Standardfeilen er ALLTID mindre.
•Anta at plug-in alltid fungerer -- for lite n gir estimert SE ekstra variabilitet og darligere dekningsgrad.

Konfidensintervaller

•Snu ulikheten feil når du løser for theta fra den pivotale ulikheten.
•Forveksle chi^2_{n, 0.025} og chi^2_{n, 0.975}. Husk: den ovre persentilen gir den nedre grensen for theta.
•Bruke z-verdier i stedet for chi^2-verdier når fordelingen er eksakt kjikvadrat.
•Glemme å dividere alpha på 2 for tosidig konfidensintervall.

Lineaer regresjon

•Forveksle formelen for beta_1-hat (med x-bar) og gamma_1-hat (uten x-bar).
•Glemme at V(beta_1-hat) har sum(x_i - x-bar)^2 i nevneren, mens V(gamma_1-hat) har sum(x_i^2).
•Konkludere med at en modell er 'bedre' bare fordi R^2 er høyere -- vurder parsimonitet.
•Glemme å sjekke forutsetningene: uavhengige feil med konstant varians.

Median, kvantiler og transformasjon av variabler

•Forveksle median og forventning -- for skjeve fordelinger (lognormal, Pareto) er de forskjellige, og oppgaven spør ofte hvilken som best beskriver dataene.
•Glemme absoluttverdien av Jacobi-determinanten. Tettheten kan aldri være negativ.
•Ikke oversette integrasjonsomradet til de nye variablene. Tegn alltid omradet i (u,v)-planet.
•Ved CDF-metoden: glemme a snu ulikheten riktig når g er avtagende, eller glemme symmetriledd (som for Y = Z^2 der både +sqrt(y) og -sqrt(y) bidrar).

Bootstrap og simulering

•Glemme at ikke-parametrisk bootstrap trekker MED tilbakelegging -- uten tilbakelegging far man bare det opprinnelige utvalget på nytt.
•Blande sammen parametrisk og ikke-parametrisk: forskjellen ligger KUN i hvor man trekker bootstrap-utvalget fra.
•Tro at bootstrap gir den sanne standardfeilen -- det er et estimat som selv har usikkerhet og avhenger av B.
•Forveksle standardavviket i dataene med standardfeilen til estimatoren -- bootstrap estimerer det siste.

Poissonprosess og ventetider

•Forveksle raten alpha (hendelser per tidsenhet) med forventet ventetid 1/alpha.
•Glemme a koble P(T > t) til P(X(t) = 0) -- det er denne sammenhengen som gir eksponensialfordelingen.
•Tro at en Poissonprosess 'husker' ventetiden. Eksponensialfordelingen er minneloes; sannsynligheten for neste hendelse avhenger ikke av hvor lenge man har ventet.
•Blande sammen enheter (timer vs. dogn) når raten skaleres til et annet tidsintervall.

Eksamenstips

Sannsynlighetsregning og Bayes' formel

•Bayes/betinget sannsynlighet dukker opp på rundt halvparten av eksamenene (bla. 2017, 2018, 2020, 2021, 2022, 2023), ofte som en kort Oppgave 1. Men ikke alltid -- flere ar apner i stedet med en ren fordelingsoppgave, så ikke regn med at Oppgave 1 garantert er Bayes.
•Definer hendelsene med tydelige symboler (f.eks. M = mutasjon, O = overlever) for du begynner.
•Sjekk alltid at sannsynlighetene summerer til 1 som en kontroll.
•Et tilbakevendende format er medisinsk testing med sensitivitet/spesifisitet (antistofftest 2020, koronatest 2021): sensitivitet = P(positiv|syk), spesifisitet = P(negativ|frisk). Da blir P(syk|positiv) ofte overraskende lav når sykdommen er sjelden -- kommenter dette poenget eksplisitt.
•Itererte/sekvensielle Bayes (resistens 2023, gjentatt kur) er et yndet pamonster: posterior fra første runde blir prior i neste.

Diskrete fordelinger (Poisson)

•Poisson er brukt på eksamen V2022, V2024 og delvis V2023. Forvent den hvert ar.
•Vis at du kan bruke MGF til å utlede E(X) og V(X) -- dette er en vanlig 'vis at'-oppgave.
•Komplementregelen P(X >= 1) = 1 - P(X = 0) = 1 - e^(-lambda) er ekstremt nyttig.
•Når oppgaven gir empirisk varians som er mye større enn gjennomsnittet, kommenter overdispersjon.

Kontinuerlige fordelinger

•MGF-utledning (vis at E(X) = ... via M'(0)) er en gjenganger nesten hvert ar (gamma, eksponensial, Poisson, geometrisk, Laplace). Oev på å derivere MGF raskt og evaluere i t = 0.
•Gamma-summeegenskapen (sum av uavhengige gamma med SAMME skalaparameter er gamma) er det mest brukte enkeltresultatet i kurset -- den brukes til å finne fordelingen til 2*sum, n*sigma-hat^2/sigma^2 osv., ar etter ar.
•Nesten hvert ar introduseres en NY navngitt fordeling (Pareto 2017, Rayleigh 2019, Weibull 2021, lognormal 2020, Laplace 2016/2024) med en standard verktøy-meny: vis CDF, finn median, vis at en transformasjon gir gamma(1,2) eller gamma(n,2). Lar deg gjenkjenne dette monsteret, så er oppgaven lik selv om fordelingen er ukjent.
•Bruk det oppgitte integralet $\int_0^\infty x^{a-1} e^{-x/b} dx = b^a \Gamma(a)$ aktivt -- det er oppgitt på eksamen av en grunn, og brukes til å finne E(X^r) for gamma/Weibull/Rayleigh.
•Kjikvadrat = gamma(n/2, 2): denne broa kobler normalfordeling, varians-estimering og konfidensintervaller, og dukker opp gjentatte ganger.

Simultanfordelinger og marginalfordelinger

•Simultanfordeling-oppgaven krever mye integrasjon. Oev på å sette opp dobbeltintegraler raskt.
•Uavhengighetssjekk: prøv a faktorisere f(x,y). Dersom det finnes et xy-ledd, er de avhengige.
•På V2024 ble det spurt om kumulativ fordeling og median -- vit hvordan du går fra f_Y til F_Y.
•Denne oppgaven er gjerne den mest beregningskrevende. Alloker nok tid.

Maksimum likelihood-estimering (MLE)

•MLE-utledning kommer ALLTID på eksamen. Oev på Poisson, eksponensial og Laplace.
•Vis alltid fullstendig utledning: likelihood -> log-likelihood -> deriver -> sett lik 0 -> los.
•Når oppgaven ber om momentestimator i tillegg, argumenter kort for at E(X) = theta gir same resultat.
•Husk formelen for derivering av ln: d/d(theta) [ln(theta)] = 1/theta.

Egenskaper ved estimatorer

•Beregn alltid E(theta-hat) først for å sjekke forventningsretthet -- det gir poeng selv om du ikke klarer variansen.
•Bruk regnereglene steg for steg og vis alle mellomregninger tydelig.
•Når standardfeilen avhenger av ukjente parametre, estimer den ved å plugge inn MLE.
•V2024 Oppg 1d og V2022 Oppg 2e hadde begge 'finn standardfeilen'-oppgaver. Forvent dette.

Sentralgrenseteoremet og normalapproksimasjon

•SGT-argumentet er et standardsvar: nevn at X_i er i.i.d., oppgi E og V, og konkluder med normalapproks.
•V2024 hadde en simuleringsoppgave om sammenligning av KI -- forstatt å diskutere dekningsgrad vs n.
•Når oppgaven sier 'argumenter for at Z er tilnaermet N(0,1)', er det SGT som ettersporres.
•Husk z-verdiene: z_0.025 = 1.960, z_0.05 = 1.645, z_0.005 = 2.576.

Konfidensintervaller

•KI-konstruksjon er på HVER eksamen. Forstatt de tre metodene: normal, kjikvadrat, algebraisk løsning.
•Når oppgaven oppgir chi^2-persentiler, forventes eksakt KI via kjikvadrat -- ikke bruk normalapproks da.
•V2024 testet to ulike KI for same parameter og ba om diskusjon. Vaer forberedt på a sammenligne.
•Sjekk alltid at nedre grense < ovre grense som en fornuftssjekk.

Lineaer regresjon

•Utledning av MKM (deriver summen av kvadrater, sett lik null) er en standard 'vis at'-oppgave.
•V2024 testet modellvalg mellom med og uten konstantledd -- dette er et typisk format.
•Forventning og varians av gamma_1-hat under FEIL modell (bias-varians avveining) er et avansert tema som dukket opp V2024d.
•Regresjonsoppgaven kobler sammen MKM, estimatoregenskaper og KI -- det er en syntese-oppgave.

Median, kvantiler og transformasjon av variabler

•Medianen via 'sett CDF = 1/2 og los' er en nesten arlig 'vis at'-oppgave (Pareto 2017, Rayleigh 2019, Weibull 2021, eksponensial 2015). Den er rask uttelling.
•Transformasjonen U = X + Y, V = X dukker opp flere ar (2015, 2019, 2020) -- oev på å sette opp Jacobi og finne det nye omradet.
•CDF-metoden er den palitelige veien til å vise at en transformasjon er gamma/kjikvadratfordelt; bruk den når du star fast.
•Husk tolkningen: medianen deler massen i to og er robust mot ekstreme verdier -- nevn dette når oppgaven ber deg 'forklare hva medianen gir uttrykk for'.

Bootstrap og simulering

•Bootstrap kommer nesten alltid som et FORKLARINGSsporsmal ('beskriv hvordan ...'). Lar deg de fire stegene utenat: trekk utvalg, regn estimator, gjenta B ganger, ta empirisk standardavvik.
•Si tydelig om det er parametrisk (trekk fra modell) eller ikke-parametrisk (trekk fra data med tilbakelegging) -- det er det sensor ser etter.
•Når to bootstrap-standardfeil sammenlignes: lavere = mer presis estimator. Koble gjerne til forventningsretthet for en helhetsvurdering.
•Ved simuleringsstudier av konfidensintervaller: diskuter dekningsgrad mot nominelt niva (f.eks. 95 %) og hvordan den blir bedre når n vokser.

Poissonprosess og ventetider

•Når en oppgave gir en 'rate per tidsenhet', tenk Poissonprosess: antall hendelser er Pois(alpha*t), ventetid er Exp(alpha).
•Standardtrikket P(T > t) = P(X(t) = 0) = e^(-alpha t) brukes til å utlede ventetidens fordeling -- det ble eksplisitt bedt om i 2019.
•Minneloesheten er et yndet bevis-/argumentsporsmal (Geigerteller 2023): vis det via den betingede sannsynligheten.
•Tid til r-te hendelse er gamma(r, 1/alpha) -- nok en anvendelse av gamma-summeegenskapen.

STK1100

Cheat Sheet

Formler, begreper og oppsummering

Sannsynlighet og statistiske metoder

eksamenssett.no

Formler

Sannsynlighetsregning

• $P(A|B) = \frac{P(A \cap B)}{P(B)}$ (Betinget sannsynlighet)
• $P(A) = \sum_i P(A|B_i) P(B_i)$ (Total sannsynlighet)
• $P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum_i P(A|B_i)P(B_i)}$ (Bayes' formel)

Diskrete fordelinger

•Poisson: $P(X=x) = \frac{\lambda^x}{x!}e^{-\lambda}$ , $E(X) = V(X) = \lambda$
•Poisson MGF: $M_X(t) = e^{\lambda(e^t - 1)}$
•Sum av uavhengige Poisson: $\text{Pois}(\lambda_1) + \text{Pois}(\lambda_2) = \text{Pois}(\lambda_1 + \lambda_2)$

Kontinuerlige fordelinger

•Eksponensial: $f(x) = \frac{1}{\mu}e^{-x/\mu}$ , $E(X)=\mu$ , $V(X)=\mu^2$ , $M_X(t) = \frac{1}{1-t\mu}$
•Gamma: $f(x) = \frac{x^{\alpha-1}}{\beta^\alpha \Gamma(\alpha)}e^{-x/\beta}$ , $E(X)=\alpha\beta$ , $V(X)=\alpha\beta^2$
•Normal: $f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$
• $\chi^2_n = \text{Gamma}(n/2, 2)$
•Laplace: $f(x) = \frac{1}{2\sigma}e^{-|x|/\sigma}$ , $E(|X|) = \sigma$ , $V(|X|) = \sigma^2$

Estimering

• $L(\theta) = \prod f(x_i; \theta)$ , $\ell(\theta) = \sum \ln f(x_i; \theta)$
•MLE: $\frac{d\ell}{d\theta} = 0$
•Poisson MLE: $\hat{\lambda} = \bar{X}$
•Eksponensial MLE: $\hat{\mu} = \bar{X}$
• $V(\bar{X}) = \sigma^2 / n$ (Varians til gjennomsnittet)

Sentralgrenseteoremet og konfidensintervaller

• $\bar{X} \approx N(\mu, \sigma^2/n)$ for stor $n$
•Standard KI: $\hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$
• $z_{0.025} = 1.960$ , $z_{0.05} = 1.645$ , $z_{0.005} = 2.576$

Lineaer regresjon

• $\hat{\beta}_1 = \frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2}$ , $\hat{\beta}_0 = \bar{y} - \hat{\beta}_1\bar{x}$
• $\hat{\gamma}_1 = \frac{\sum x_iy_i}{\sum x_i^2}$ (uten konstantledd)
• $V(\hat{\beta}_1) = \frac{\sigma^2}{\sum(x_i-\bar{x})^2}$
• $V(\hat{\gamma}_1) = \frac{\sigma^2}{\sum x_i^2}$

Median, transformasjon og Poissonprosess

•Median: $F_X(\tilde{\mu}) = \tfrac{1}{2}$
•Transformasjon (2D): $f_{U,V}(u,v) = f_{X,Y}(x,y)\,|\det J|$
•Poissonprosess: $X(t) \sim \text{Pois}(\alpha t)$ , ventetid $T \sim \text{Exp}(\alpha)$ , $P(T>t)=e^{-\alpha t}$
•Minneloeshet: $P(T > s+t \mid T > s) = P(T > t)$

Bootstrap

•Bootstrap-standardfeil: $\hat{\sigma}_{\hat{\theta}} = \sqrt{\frac{1}{B-1}\sum_{b=1}^B (\hat{\theta}^*_b - \bar{\hat{\theta}}^*)^2}$
•Ikke-parametrisk: trekk med tilbakelegging fra data
•Parametrisk: trekk fra modell med $\hat{\theta}$ innsatt

Nyttige integraler

• $\int_0^\infty x^{a-1} e^{-x/b} \, dx = b^a \Gamma(a)$
• $\Gamma(a) = (a-1)!$ for heltall $a$
• $\Gamma(1/2) = \sqrt{\pi}$

Nøkkelformler per tema

Sannsynlighetsregning og Bayes' formel

• $P(A \mid B) = \frac{P(A \cap B)}{P(B)}$ (Betinget sannsynlighet)
• $P(A) = \sum_{i} P(A \mid B_i) P(B_i)$ (Total sannsynlighet)
• $P(B_j \mid A) = \frac{P(A \mid B_j) P(B_j)}{\sum_i P(A \mid B_i) P(B_i)}$ (Bayes' formel)
• $P(A^c) = 1 - P(A)$ (Komplementregelen)

Diskrete fordelinger (Poisson)

• $P(X = x) = \frac{\lambda^x}{x!} e^{-\lambda}$ (Poisson punktsannsynlighet)
• $E(X) = V(X) = \lambda$ (Forventning = Varians)
• $M_X(t) = e^{\lambda(e^t - 1)}$ (Momentgenererende funksjon)
• $X_1 + X_2 \sim \text{Pois}(\lambda_1 + \lambda_2)$ (Sum av uavhengige Poisson)
• $X \sim \text{Pois}(\lambda v_0)$ når raten er $\lambda$ per enhet over $v_0$ enheter

Kontinuerlige fordelinger

• $f_X(x) = \frac{1}{\mu} e^{-x/\mu}$ for $x > 0$ (Eksponensialfordeling)
• $E(X) = \mu, \quad V(X) = \mu^2, \quad M_X(t) = \frac{1}{1-t\mu}$ (Eksponensial)
• $f_X(x) = \frac{x^{\alpha-1}}{\beta^\alpha \Gamma(\alpha)} e^{-x/\beta}$ (Gammafordeling)
• $\text{Gamma}(n/2, 2) = \chi^2_n$ (Kjikvadrat = spesialtilfelle av gamma)
• $\sum X_i \sim \text{Gamma}(\sum \alpha_i, \beta)$ for uavhengige med samme $\beta$

Simultanfordelinger og marginalfordelinger

• $f_X(x) = \int f(x,y) \, dy$ (Marginaltetthet)
• $f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)}$ (Betinget tetthet)
•Uavhengighet: $f(x,y) = f_X(x) \cdot f_Y(y)$ for alle $(x,y)$
• $F_Y(y) = \int_{-\infty}^{y} f_Y(t) \, dt$ (Kumulativ fordeling)
• $P(Y \geq X) = \iint_{y \geq x} f(x,y) \, dx \, dy$ (Sannsynlighet over region)

Maksimum likelihood-estimering (MLE)

• $L(\theta) = \prod_{i=1}^n f(x_i; \theta)$ (Likelihood-funksjonen)
• $\ell(\theta) = \sum_{i=1}^n \ln f(x_i; \theta)$ (Log-likelihood)
• $\frac{d\ell}{d\theta} = 0$ (Likelihoodligningen)

Egenskaper ved estimatorer

• $E(\hat{\theta}) = \theta$ (Forventningsretthet)
• $\text{SE}(\hat{\theta}) = \sqrt{V(\hat{\theta})}$ (Standardfeil)
• $V(aX + b) = a^2 V(X)$ (Variansregel for lineaer transformasjon)
• $V\left(\sum X_i\right) = \sum V(X_i)$ (for uavhengige variabler)

Sentralgrenseteoremet og normalapproksimasjon

• $\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)$ for stor $n$ (SGT)
• $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \approx N(0,1)$ (Standardisering)
• $Z' = \frac{\hat{\theta} - \theta}{\widehat{\text{SE}}(\hat{\theta})} \approx N(0,1)$ (Slutsky / plug-in)

Konfidensintervaller

• $\hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$ (Standard normalbasert KI)
• $\left[\frac{2n\hat{\mu}}{\chi^2_{2n, \alpha/2}}, \, \frac{2n\hat{\mu}}{\chi^2_{2n, 1-\alpha/2}}\right]$ (Kjikvadratbasert KI for $\mu$)
• $\left[\frac{n\hat{\sigma}^2}{\chi^2_{n, \alpha/2}}, \, \frac{n\hat{\sigma}^2}{\chi^2_{n, 1-\alpha/2}}\right]$ (KI for $\sigma^2$)
• $z_{0.025} = 1.960, \quad z_{0.05} = 1.645, \quad z_{0.005} = 2.576$ (Kritiske verdier)

Lineaer regresjon

• $\hat{\beta}_1 = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sum(x_i - \bar{x})^2}$ (MKM stigningstall)
• $\hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x}$ (MKM konstantledd)
• $\hat{\gamma}_1 = \frac{\sum x_i y_i}{\sum x_i^2}$ (MKM uten konstantledd)
• $V(\hat{\beta}_1) = \frac{\sigma^2}{\sum(x_i - \bar{x})^2}$ (Varians til stigningstall)
• $V(\hat{\gamma}_1) = \frac{\sigma^2}{\sum x_i^2}$ (Varians uten konstantledd)

Median, kvantiler og transformasjon av variabler

• $F_X(\tilde{\mu}) = \tfrac{1}{2}$ (Medianligningen)
• $f_Y(y) = \frac{d}{dy} F_Y(y) = \frac{d}{dy} P(g(X) \le y)$ (CDF-metoden, en variabel)
• $f_{U,V}(u,v) = f_{X,Y}(x(u,v), y(u,v)) \, |\det J|$ (Jacobi-metoden)
• $|\det J| = \left| \frac{\partial x}{\partial u}\frac{\partial y}{\partial v} - \frac{\partial x}{\partial v}\frac{\partial y}{\partial u} \right|$ (Jacobi-determinant, 2D)

Bootstrap og simulering

• $\hat{\sigma}_{\hat{\theta}} = \sqrt{\frac{1}{B-1}\sum_{b=1}^B (\hat{\theta}^*_b - \bar{\hat{\theta}}^*)^2}$ (Bootstrap-standardfeil)
•Ikke-parametrisk: trekk $x_1^*, \ldots, x_n^*$ med tilbakelegging fra dataene
•Parametrisk: trekk $x_1^*, \ldots, x_n^*$ fra modellen med $\hat{\theta}$ satt inn
•Dekningsgrad: andelen av simulerte konfidensintervaller som inneholder sann $\theta$

Poissonprosess og ventetider

• $X(t) \sim \text{Pois}(\alpha t)$ (Antall hendelser i intervall av lengde t)
• $P(T > t) = e^{-\alpha t}, \quad f_T(t) = \alpha e^{-\alpha t}$ (Ventetid til første hendelse)
• $P(T > s+t \mid T > s) = P(T > t)$ (Minneloeshet)
•Tid til r-te hendelse: $\sim \text{gamma}(r, 1/\alpha)$ , forventning $r/\alpha$

Vanlige feil å unngå

Sannsynlighetsregning og Bayes' formel

•Forveksle P(A|B) og P(B|A) -- de er generelt IKKE like. Bayes' formel snur rekkefølgen.
•Glemme å bruke total sannsynlighet i nevneren til Bayes' formel.
•I itererte Bayes-oppgaver: bruke den opprinnelige prior i stedet for den oppdaterte posterior.
•Blande disjunkte og uavhengige hendelser. Disjunkte hendelser med positiv sannsynlighet er alltid avhengige.

Diskrete fordelinger (Poisson)

•Glemme at Poisson krever E(X) = V(X). Sjekk alltid dette for å vurdere modellens gyldighet.
•Forveksle rateparameteren lambda (per enhet) med den totale parameteren lambda*v0.
•Ved bruk av MGF: glemme å evaluere i t = 0 etter derivering.
•Blande P(X >= 1) = 1 - P(X = 0) med P(X > 1) = 1 - P(X = 0) - P(X = 1).

Kontinuerlige fordelinger

•Forveksle parametriseringen av eksponensialfordelingen: noen bruker rate 1/mu, andre bruker forventning mu. STK1100 bruker mu som forventning.
•Glemme at gamma-summeegenskapen kun gjelder når skalaparameteren beta er lik.
•Ved transformasjonsformelen: glemme å ta absoluttverdien av Jacobi-determinanten.
•Forveksle Gamma(1/2, 2) med Gamma(2, 1/2) -- skriv alltid (formparameter, skalaparameter).

Simultanfordelinger og marginalfordelinger

•Sette feil integrasjonsgrenser når man integrerer ut en variabel. Tegn alltid omradet!
•Konkludere med uavhengighet bare fordi man ser et produkt -- sjekk at faktorene kun avhenger av en variabel hver.
•Glemme at betinget tetthet er udefinert når f_X(x) = 0.
•Beregne P(Y >= X) med feil integrasjonsomrade. Tegn omradet i xy-planet først.

Maksimum likelihood-estimering (MLE)

•Glemme å ta logaritmen av likelihood-funksjonen for derivering -- det er mye enklere a jobbe med log-likelihood.
•Derivere log-likelihood feil, særlig med absoluttverdier som i Laplace-fordelingen.
•Anta at MLE og momentestimator alltid er like -- det gjelder for eksponensialfamilien, men ikke generelt.
•Glemme å sjekke at løsningen gir et maksimum, ikke et minimum (andrederivert-test).

Egenskaper ved estimatorer

•Glemme at V(X1 + X2) = V(X1) + V(X2) kun gjelder for UAVHENGIGE variabler.
•Blande varians og standardfeil -- standardfeil er kvadratroten av variansen.
•Glemme å kvadrere konstanten foran i variansregelen: V(aX) = a^2 V(X), IKKE a V(X).
•Plugge inn estimatet i standardfeilen uten å nevne at det er en estimert standardfeil.

Sentralgrenseteoremet og normalapproksimasjon

•Bruke SGT når n er for liten (f.eks. n = 5). Argumenter alltid for at n er 'tilstrekkelig stor'.
•Glemme å nevne SGT eksplisitt -- skriv 'ved sentralgrenseteoremet' når du bruker det.
•Forveksle sigma/sqrt(n) (standardfeil) med sigma (standardavvik). Standardfeilen er ALLTID mindre.
•Anta at plug-in alltid fungerer -- for lite n gir estimert SE ekstra variabilitet og darligere dekningsgrad.

Konfidensintervaller

•Snu ulikheten feil når du løser for theta fra den pivotale ulikheten.
•Forveksle chi^2_{n, 0.025} og chi^2_{n, 0.975}. Husk: den ovre persentilen gir den nedre grensen for theta.
•Bruke z-verdier i stedet for chi^2-verdier når fordelingen er eksakt kjikvadrat.
•Glemme å dividere alpha på 2 for tosidig konfidensintervall.

Lineaer regresjon

•Forveksle formelen for beta_1-hat (med x-bar) og gamma_1-hat (uten x-bar).
•Glemme at V(beta_1-hat) har sum(x_i - x-bar)^2 i nevneren, mens V(gamma_1-hat) har sum(x_i^2).
•Konkludere med at en modell er 'bedre' bare fordi R^2 er høyere -- vurder parsimonitet.
•Glemme å sjekke forutsetningene: uavhengige feil med konstant varians.

Median, kvantiler og transformasjon av variabler

•Forveksle median og forventning -- for skjeve fordelinger (lognormal, Pareto) er de forskjellige, og oppgaven spør ofte hvilken som best beskriver dataene.
•Glemme absoluttverdien av Jacobi-determinanten. Tettheten kan aldri være negativ.
•Ikke oversette integrasjonsomradet til de nye variablene. Tegn alltid omradet i (u,v)-planet.
•Ved CDF-metoden: glemme a snu ulikheten riktig når g er avtagende, eller glemme symmetriledd (som for Y = Z^2 der både +sqrt(y) og -sqrt(y) bidrar).

Bootstrap og simulering

•Glemme at ikke-parametrisk bootstrap trekker MED tilbakelegging -- uten tilbakelegging far man bare det opprinnelige utvalget på nytt.
•Blande sammen parametrisk og ikke-parametrisk: forskjellen ligger KUN i hvor man trekker bootstrap-utvalget fra.
•Tro at bootstrap gir den sanne standardfeilen -- det er et estimat som selv har usikkerhet og avhenger av B.
•Forveksle standardavviket i dataene med standardfeilen til estimatoren -- bootstrap estimerer det siste.

Poissonprosess og ventetider

•Forveksle raten alpha (hendelser per tidsenhet) med forventet ventetid 1/alpha.
•Glemme a koble P(T > t) til P(X(t) = 0) -- det er denne sammenhengen som gir eksponensialfordelingen.
•Tro at en Poissonprosess 'husker' ventetiden. Eksponensialfordelingen er minneloes; sannsynligheten for neste hendelse avhenger ikke av hvor lenge man har ventet.
•Blande sammen enheter (timer vs. dogn) når raten skaleres til et annet tidsintervall.

Eksamenstips

Sannsynlighetsregning og Bayes' formel

•Bayes/betinget sannsynlighet dukker opp på rundt halvparten av eksamenene (bla. 2017, 2018, 2020, 2021, 2022, 2023), ofte som en kort Oppgave 1. Men ikke alltid -- flere ar apner i stedet med en ren fordelingsoppgave, så ikke regn med at Oppgave 1 garantert er Bayes.
•Definer hendelsene med tydelige symboler (f.eks. M = mutasjon, O = overlever) for du begynner.
•Sjekk alltid at sannsynlighetene summerer til 1 som en kontroll.
•Et tilbakevendende format er medisinsk testing med sensitivitet/spesifisitet (antistofftest 2020, koronatest 2021): sensitivitet = P(positiv|syk), spesifisitet = P(negativ|frisk). Da blir P(syk|positiv) ofte overraskende lav når sykdommen er sjelden -- kommenter dette poenget eksplisitt.
•Itererte/sekvensielle Bayes (resistens 2023, gjentatt kur) er et yndet pamonster: posterior fra første runde blir prior i neste.

Diskrete fordelinger (Poisson)

•Poisson er brukt på eksamen V2022, V2024 og delvis V2023. Forvent den hvert ar.
•Vis at du kan bruke MGF til å utlede E(X) og V(X) -- dette er en vanlig 'vis at'-oppgave.
•Komplementregelen P(X >= 1) = 1 - P(X = 0) = 1 - e^(-lambda) er ekstremt nyttig.
•Når oppgaven gir empirisk varians som er mye større enn gjennomsnittet, kommenter overdispersjon.

Kontinuerlige fordelinger

•MGF-utledning (vis at E(X) = ... via M'(0)) er en gjenganger nesten hvert ar (gamma, eksponensial, Poisson, geometrisk, Laplace). Oev på å derivere MGF raskt og evaluere i t = 0.
•Gamma-summeegenskapen (sum av uavhengige gamma med SAMME skalaparameter er gamma) er det mest brukte enkeltresultatet i kurset -- den brukes til å finne fordelingen til 2*sum, n*sigma-hat^2/sigma^2 osv., ar etter ar.
•Nesten hvert ar introduseres en NY navngitt fordeling (Pareto 2017, Rayleigh 2019, Weibull 2021, lognormal 2020, Laplace 2016/2024) med en standard verktøy-meny: vis CDF, finn median, vis at en transformasjon gir gamma(1,2) eller gamma(n,2). Lar deg gjenkjenne dette monsteret, så er oppgaven lik selv om fordelingen er ukjent.
•Bruk det oppgitte integralet $\int_0^\infty x^{a-1} e^{-x/b} dx = b^a \Gamma(a)$ aktivt -- det er oppgitt på eksamen av en grunn, og brukes til å finne E(X^r) for gamma/Weibull/Rayleigh.
•Kjikvadrat = gamma(n/2, 2): denne broa kobler normalfordeling, varians-estimering og konfidensintervaller, og dukker opp gjentatte ganger.

Simultanfordelinger og marginalfordelinger

•Simultanfordeling-oppgaven krever mye integrasjon. Oev på å sette opp dobbeltintegraler raskt.
•Uavhengighetssjekk: prøv a faktorisere f(x,y). Dersom det finnes et xy-ledd, er de avhengige.
•På V2024 ble det spurt om kumulativ fordeling og median -- vit hvordan du går fra f_Y til F_Y.
•Denne oppgaven er gjerne den mest beregningskrevende. Alloker nok tid.

Maksimum likelihood-estimering (MLE)

•MLE-utledning kommer ALLTID på eksamen. Oev på Poisson, eksponensial og Laplace.
•Vis alltid fullstendig utledning: likelihood -> log-likelihood -> deriver -> sett lik 0 -> los.
•Når oppgaven ber om momentestimator i tillegg, argumenter kort for at E(X) = theta gir same resultat.
•Husk formelen for derivering av ln: d/d(theta) [ln(theta)] = 1/theta.

Egenskaper ved estimatorer

•Beregn alltid E(theta-hat) først for å sjekke forventningsretthet -- det gir poeng selv om du ikke klarer variansen.
•Bruk regnereglene steg for steg og vis alle mellomregninger tydelig.
•Når standardfeilen avhenger av ukjente parametre, estimer den ved å plugge inn MLE.
•V2024 Oppg 1d og V2022 Oppg 2e hadde begge 'finn standardfeilen'-oppgaver. Forvent dette.

Sentralgrenseteoremet og normalapproksimasjon

•SGT-argumentet er et standardsvar: nevn at X_i er i.i.d., oppgi E og V, og konkluder med normalapproks.
•V2024 hadde en simuleringsoppgave om sammenligning av KI -- forstatt å diskutere dekningsgrad vs n.
•Når oppgaven sier 'argumenter for at Z er tilnaermet N(0,1)', er det SGT som ettersporres.
•Husk z-verdiene: z_0.025 = 1.960, z_0.05 = 1.645, z_0.005 = 2.576.

Konfidensintervaller

•KI-konstruksjon er på HVER eksamen. Forstatt de tre metodene: normal, kjikvadrat, algebraisk løsning.
•Når oppgaven oppgir chi^2-persentiler, forventes eksakt KI via kjikvadrat -- ikke bruk normalapproks da.
•V2024 testet to ulike KI for same parameter og ba om diskusjon. Vaer forberedt på a sammenligne.
•Sjekk alltid at nedre grense < ovre grense som en fornuftssjekk.

Lineaer regresjon

•Utledning av MKM (deriver summen av kvadrater, sett lik null) er en standard 'vis at'-oppgave.
•V2024 testet modellvalg mellom med og uten konstantledd -- dette er et typisk format.
•Forventning og varians av gamma_1-hat under FEIL modell (bias-varians avveining) er et avansert tema som dukket opp V2024d.
•Regresjonsoppgaven kobler sammen MKM, estimatoregenskaper og KI -- det er en syntese-oppgave.

Median, kvantiler og transformasjon av variabler

•Medianen via 'sett CDF = 1/2 og los' er en nesten arlig 'vis at'-oppgave (Pareto 2017, Rayleigh 2019, Weibull 2021, eksponensial 2015). Den er rask uttelling.
•Transformasjonen U = X + Y, V = X dukker opp flere ar (2015, 2019, 2020) -- oev på å sette opp Jacobi og finne det nye omradet.
•CDF-metoden er den palitelige veien til å vise at en transformasjon er gamma/kjikvadratfordelt; bruk den når du star fast.
•Husk tolkningen: medianen deler massen i to og er robust mot ekstreme verdier -- nevn dette når oppgaven ber deg 'forklare hva medianen gir uttrykk for'.

Bootstrap og simulering

•Bootstrap kommer nesten alltid som et FORKLARINGSsporsmal ('beskriv hvordan ...'). Lar deg de fire stegene utenat: trekk utvalg, regn estimator, gjenta B ganger, ta empirisk standardavvik.
•Si tydelig om det er parametrisk (trekk fra modell) eller ikke-parametrisk (trekk fra data med tilbakelegging) -- det er det sensor ser etter.
•Når to bootstrap-standardfeil sammenlignes: lavere = mer presis estimator. Koble gjerne til forventningsretthet for en helhetsvurdering.
•Ved simuleringsstudier av konfidensintervaller: diskuter dekningsgrad mot nominelt niva (f.eks. 95 %) og hvordan den blir bedre når n vokser.

Poissonprosess og ventetider

•Når en oppgave gir en 'rate per tidsenhet', tenk Poissonprosess: antall hendelser er Pois(alpha*t), ventetid er Exp(alpha).
•Standardtrikket P(T > t) = P(X(t) = 0) = e^(-alpha t) brukes til å utlede ventetidens fordeling -- det ble eksplisitt bedt om i 2019.
•Minneloesheten er et yndet bevis-/argumentsporsmal (Geigerteller 2023): vis det via den betingede sannsynligheten.
•Tid til r-te hendelse er gamma(r, 1/alpha) -- nok en anvendelse av gamma-summeegenskapen.