Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
TMA4240 Statistikk H2010Kapittel 6: Kontinuerlige sannsynlighetsfordelinger6.4-5.7: Normalfordelingen, normalapproksimasjon,eksponensial og gamma.
Mette Langaas
Foreleses mandag 27. september 2010
www.ntnu.no [email protected], TMA4240H2010
2
Normalfordelingen
www.ntnu.no [email protected], TMA4240H2010
3
Chebyshevs teorem ognormalfordelingen
— Chebyshevs teorem:P(µ− kσ < X < µ+ kσ) ≥ 1− 1k2
— Nøyaktig for normalfordelingen:• k=1: P(µ− σ < X < µ+ σ) = 0.683 mot Chebyshev ≥ 0.• k=2: P(µ− 2σ < X < µ+ 2σ) = 0.954 mot Chebyshev ≥ 0.75• k=3: P(µ− 3σ < X < µ+ 3σ) = 0.997 mot Chebyshev ≥ 0.89
www.ntnu.no [email protected], TMA4240H2010
4
6.5 Normalapproksimasjon tilbinomisk fordeling
TEO 6.2 Hvis X er en binomisk stokastisk variabel medforventning µ = np og varians σ2 = np(1− p), så vilden stokastiske variabelen
Z =X − µσ
=X − np√np(1− p)
når n→∞ være tilnærmet standard normalfordelt,n(z; 0,1).
www.ntnu.no [email protected], TMA4240H2010
5
6.5 Normalapproksimasjon tilbinomisk fordeling
www.ntnu.no [email protected], TMA4240H2010
6
Regneeksempel fra Cartoon Guide
— Binomisk med n = 25, p = 0.5.
— Hva er P(X ≤ 14)?
www.ntnu.no [email protected], TMA4240H2010
7
Approksimasjon
Figsur fra Cartoon Guide to Statistics.
www.ntnu.no [email protected], TMA4240H2010
8
Kontinuitetskorreksjon
Figsur fra Cartoon Guide to Statistics.www.ntnu.no [email protected], TMA4240H2010
9
Eksempel: Trafikk-kontroll, mobilbrukPolitiet vil aksjonere mot ulovlig mobilbruk i bil, og gjennomfører kontrollved Lerkendal-rundkjøringen.
— Antar at antall bilførere som blir bøtelagt i løpet av t timer erPoisson-fordelt med intensitet λ = 5, dvs. med forventningλ · t = 5 · t .
1. Antall hendelser i disjunkte tidsintervall er uavhengige.2. Sannsynligheten for at en enkelt hendelse inntreffer innenfor et
kort tidsintervall av lengde ∆t er tilnærmet λ∆t .3. Sannsynligheten for at mer enn en hendelse skal inntreffe
innenfor et kort tidsintervall av lengde ∆t er neglisjerbar.
— Y=antall hendelser i intervallet [0, t ], er Poisson-fordelt
p(y ;λt) =e−λt (λt)y
y !y = 0,1,2, ...
hvor λ er gjennomsnittlig antall hendelser per enhet (intervall ellerregion).
www.ntnu.no [email protected], TMA4240H2010
10
Trafikk-kontroll (forts.)
— La X være tid fra kontrollen starter til første bilfører blirbøtelagt.
— X=tid til første hendelse, er eksponensialfordelt medforventning E(X ) = 1
λ .— Tid mellom to påfølgende hendelser har samme fordeling som
tid til første hendelse.
www.ntnu.no [email protected], TMA4240H2010
11
Eksponensial fordelingen
DEF: En kontinuerlig stokastisk variabel X har eneksponensialfordeling med parameter β, hvissannsynlighetstettheten er gitt ved
f (x ;β) =
{ 1βe−x/β, x > 00 ellers.
hvor β > 0.TEO 6.3, COR 1: Forventing og varians i ekponentialfordelingen er
µ = E(X ) = β σ2 = Var(X ) = β2
Annen parameterisering: λ = 1β brukes også.
www.ntnu.no [email protected], TMA4240H2010
12
Eksponensial fordelingen, f (x)
f (x ;β) for β = 1,2,3,4,5 (eller λ = 1,12,13,14,15
)
www.ntnu.no [email protected], TMA4240H2010
13
Eksempel: Trafikk-kontroll (forts.)
1. Hva er forventet tid til første bøtelegging?
2. Hvor sannsynlig er det at første bot blir skrevet ut før det er gått 20min?
3. Hva er sannynligheten for at det tar mer enn 3 timer til første botskrives ut?
4. Dersom ingen er bøtelagt etter 20 min., hva er sannsynligheten for atden første bot ikke blir skrevet ut i løpet av de neste 20 min.?
5. Hva er sannsynligheten for at det tar mer enn en time før 2 bøter erskrevet ut?
www.ntnu.no [email protected], TMA4240H2010
14
Ingen hukommelse
— En lyspære har levetid X , som er eksponentialfordelt medparameter β.
f (x ;β) =
{ 1βe−x/β, x > 00 ellers.
— Vi vet at lyspæra har virket i s timer, hva er da sannsynlighetenfor at den virker t timer til?
Har atP(X > s + t | X > s) = P(X > s + t − s) = 1− F (t), derF (t) = P(X ≤ t) er kumulativ fordeling for X , innsatt t .
www.ntnu.no [email protected], TMA4240H2010
15
Tid til nte hendelse
— Trafikk-kontroll:Hva er sannsynligheten for at det tar mer enn en timefør 2 bøter er skrevet ut?
— Lyspærer: Jeg kjøper en pakke med 10 lyspærer til stekeovnen min.Hvor lang tid holder de?
— SMS til basestasjon: Hvor lang til går det til basestasjonen harmottatt 100 SMS?
— Trafikk-kontroll: Foto-boks står montert i tunnel. Den kan ta 36 bilder(?). Hvor langt tid tar det før veivesenet bør skifte film?
— Promillekontroll: Hvor lenge må politiet stå på post før de har fått 5personer som har blåst rødt?
www.ntnu.no [email protected], TMA4240H2010
16
Gamma-fordelingen
DEF: En kontinuerlig stokastisk variabel X følger engammafordeling med parametere α og β, hvissannsynlighetstettheten er gitt ved
f (x ;α, β) =
{1
βαΓ(α)xα−1e−x/β, x > 00 ellers.
hvor α > 0 og β > 0.Parametere: α er formparameter, β er skalaparameter.Eksponensial: er Gamma med α = 1.
Erlang: er Gamma med α heltall.
www.ntnu.no [email protected], TMA4240H2010
17
Gamma fordelingen (forts.)
DEF 6.2: Gammafunksjonen er definert som
Γ(α) =
∫ ∞
0xα−1e−xdx
for α > 0.— Γ(1) = 1.— For α positivt naturlig tall:
Γ(α) = (α− 1) · (α− 2) · · · (α− n) · Γ(α− n).— For α positivt heltall: Γ(α) = (α− 1)!
TEO 6.3: Forventing og varians i gammafordelingen:
µ = E(X ) = αβ σ2 = Var(X ) = αβ2
www.ntnu.no [email protected], TMA4240H2010
18
Gammafordelingen, f (x)
α=1 α=10
β = 1
β = 4
www.ntnu.no [email protected], TMA4240H2010
19
Trafikk-kontroll, mobilbruk (forts.)Hva er sannsynligheten for at det tar mer enn en time før 2 bøter erskrevet ut?
— La X være antall timar til andre bøtelegging.X er Gammafordelt med α = 2, β = 1
λ = 15 .
P(X > 1) = 1− P(X ≤ 1)
P(X ≤ 1) =
∫ 1
0
1(
15
)2
Γ(2)
x1e−5xdx
= 25∫ 1
0xe−5xdx = delvis integrasjon. . . = 0.96
⇒ P(X > 1) = 1− P(X ≤ 1) = 1− 0.96 = 0.04
www.ntnu.no [email protected], TMA4240H2010
20
6.8 Kjikvadrat fordelingen
(mer fullstendig sammen med statistisk inferens)DEF En kontinuerlig stokastisk variabel X er kji-kvadrat
fordelt parameter ν (kalt frihetgrader), hvissannsynlighetstettheten er gitt ved
f (x ; ν) =
{1
2ν/2Γ(ν/2)xν/2−1e−x/2, x > 0
0 ellers.
hvor ν er et positivt heltall.Kji-kvadrat vs. gamma: Kji-kvadrat er gamma med α = ν/2 og
β = 2.
www.ntnu.no [email protected], TMA4240H2010
21
Kjikvadrat fordelingen (forts.)
Forventing og varians i kji-kvadrat fordelingen er
µ = E(X ) = ν σ2 = Var(X ) = 2 · ν
www.ntnu.no [email protected], TMA4240H2010
22
6.10 Weibull fordelingenikke pensum, men mye brukt!
DEF: En kontinuerlig stokastisk variabel X er Weibull-fordelt,med parametere α og β, med sannsynlighetstetthet gitt ved
f (x) =
{αβxβ−1e−αxβ
, x > 00 ellers.
der α > 0 og β > 0.
Eksponensial: spesialtilfelle for β = 1
www.ntnu.no [email protected], TMA4240H2010