Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Kursus 02402Introduktion til Statistik
Forelæsning 4: Kapitel 5: Kontinuerte fordelinger
Per Bruun Brockhoff
DTU Compute, Statistik og DataanalyseBygning 324, Rum 220Danmarks Tekniske Universitet2800 Lyngby – Danmark
e-mail: [email protected]
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 1 / 37
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 2 / 37
Intro
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 3 / 37
Intro
Nogle anvendte fordelinger
(Både kontinuerte og diskerete)Diskrete:
Binomial fordelingenDen hypergeometriske fordelingPoisson fordelingen
Kontinuerte:Normal fordelingenLog-Normal fordelingenUniform fordelingenEksponential fordelingen
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 4 / 37
Eksponential fordelingen
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 5 / 37
Eksponential fordelingen
Eksponential fordelingen
f(x) =
{ 1βe−x/β x > 0, β > 0
0 ellers
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 6 / 37
Eksponential fordelingen
Eksponentialfordelingen
Eksponential fordelingen er et special tilfælde afGamma fordelingenEksponential fordelingen anvendes f.eks. til at beskrivelevetider og ventetiderEksponential fordelingen kan bruges til at beskrive(vente)tiden mellem hændelser i poisson fordelingenMiddelværdi µ = β
Varians σ2 = β2
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 7 / 37
Eksponential fordelingen
Sammenhæng mellem Eksponential og Poisson fordelingen
tid t∗ ∗ ∗ ∗ ∗ ∗ ∗
t1 t2
Poisson: Diskrete hændelser pr. enhed
Eksponential: Kontinuert afstand mellem hændelser
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 8 / 37
Eksponential fordelingen
Eksponential fordelingen
−1 0 1 2 3 4 5 6 7 8 9 100
0.2
0.4
0.6
0.8
1
EXP(1)
x
Tae
thed
, f(x
)
Eksponential fordeling med β=1
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 9 / 37
Eksponential fordelingen Eksempel 1
Eksempel 1
Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter.
En kunde er netop ankommet. Hvad er sandsynligheden forat der ikke kommer flere kunder indefor en periode på 2minutter?
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 10 / 37
Eksponential fordelingen Eksempel 1
Eksempel 1
0 2 4 6 8
0.0
0.1
0.2
0.3
0.4
0.5
exp(2)
x
tæth
ed
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 11 / 37
Eksponential fordelingen Eksempel 2
Eksempel 2
Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter.
En kunde er netop ankommet. Beregn sandsynligheden forat der ikke kommer flere kunder indefor en periode på 2minutter vha. Poissonfordelingen
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 12 / 37
Eksponential fordelingen Eksempel 3
Eksempel 3
Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter. Vibetragter nu en periode på 10 minutter
Beregn sandynligheden for at der ikke kommer nogenkunder i perioden vha. Poissonfordelingen
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 13 / 37
Eksponential fordelingen Eksempel 3
Eksempel 3
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 14 / 37
Regneregler for stokastiske variable
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 15 / 37
Regneregler for stokastiske variable
Regneregler for stokastiske variable
(Gælder BÅDE kontinuert og diskret)Vi antager at a og b er konstanter og X er en stokastiskvariabel. Da gælder
E(aX + b) = aE(X) + b
V ar(aX + b) = a2V ar(X)
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 16 / 37
Regneregler for stokastiske variable Eksempel 4
Eksempel 4
En stokastisk variabel X har middelværdi 4 og varians 6.
Beregn middelværdi og varians for Y = −3X + 2
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 17 / 37
Regneregler for stokastiske variable Eksempel 4
Regneregler for stokastiske variable
Følgende linear kombinationer gælder:
E(a1X1 + a2X2 + ..+ anXn)
= a1E(X1) + a2E(X2) + ..+ anE(Xn)
V ar(a1X1 + a2X2 + ..+ anXn)
= a21V ar(X1) + ..+ a2nV ar(Xn)
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 18 / 37
Regneregler for stokastiske variable Eksempel 5
Eksempel 5
Vægten af passagerer på en flystrækning antagesnormalfordelt X ∼ N(70, 102).
Et fly, der kan tage 55 passagerer, må max. lastes med4000 kg (kun passageres vægt betragtes som last).
Beregn sandsynligheden for at flyet bliver overlastetPer Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 19 / 37
Regneregler for stokastiske variable Eksempel 5
Eksempel 5
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 20 / 37
Regneregler for stokastiske variable Eksempel 6
Eksempel 6
En færge medtager X passagerer. Det oplyses, atE[X] = 400 og V ar[X] = 402 og at X er normalfordelt.
Færgeselskabet har en fortjeneste på 120 kr. pr. passager
Beregn middelværdi og varians for færgeselskabetsfortjeneste, og beregn sandsynligheden for at fortjenestenvil overstige 50.000 kr.
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 21 / 37
Regneregler for stokastiske variable Eksempel 6
Eksempel 6
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 22 / 37
Regneregler for stokastiske variable Eksempel 7
Eksempel 7
Antag, at æg sælges i pakker á 144 æg. Sandsynlighedenfor at et tilfældig udvalgt æg er salmonella inficeret antagesat være 5%.
Et firma, der producerer fødevarer, indkøber nu 100 pakkeræg.
Hvad bliver middelværdi og varians af antal salmonellainficerede æg i den samlede forsendelse?
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 23 / 37
Regneregler for stokastiske variable Eksempel 7
Eksempel 7
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 24 / 37
Regneregler for stokastiske variable Eksempel 8
Eksempel 8
Antag, at du vil købe noget sand, da du vil lave en nyindkørsel til dit hus. Det er specielt vigtigt for dig, at derikke er sten blandet i sandet. Producenten lover, at der igennemsnit kun er 0.5 sten pr. m3.
Du køber nu 10 m3 sand og erfarer, at der er 11 sten iblandingen. Føler du dig snydt af producentens løfte om atder kun er 0.5 sten pr. m3 ?
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 25 / 37
Transformationer
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 26 / 37
Transformationer
Transformationer
Såfremt data afviger fra at være normal fordelt, kan manofte med fordel transformere data, således at detransformerede data kan antages at være normal fordelt.
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 27 / 37
Transformationer
Transformationer - Før
0 10 20 30 40 50 60 700
5
10
15
20
25
30
35
40
45
50
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 28 / 37
Transformationer
Transformationer - Efter
−0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.50
5
10
15
20
25
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 29 / 37
Transformationer
Hyppigt anvendte transformationer
Gør store værdier mindre:− 1
xln xx1/4√x
Gør store værdier større:x2
x3
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 30 / 37
Transformationer
Transformationer
Ofte vil man udføre statistiske analyser på detransformerede data, såfremt det viser sig, at detransformerede data er ’pænere’, f.eks. mere symmetriske.
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 31 / 37
Normalplot
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 32 / 37
Normalplot
Normalplot
Man kan kontrollere/undersøg om data ser ud til at værenormalfordelt:
Plotte histogramLave box plotsLave et normalplot:
En direkte sammenligning med normalfordelingen
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 33 / 37
Normalplot
Normalplot
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 34 / 37
R (R Note afsnit 5 )
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 35 / 37
R (R Note afsnit 5 )
R (R note 5) R Betegnelsenorm Normalfordelingenunif Den uniforme fordelinglnorm Log-normalfordelingenexp Exponentialfordelingen
d Tæthedsfunktion f(x) (probability distribution).p Fordelingsfunktion F (x) (cumulative distributionfunction).
q Fraktil (quantile) i fordeling.r Tilfældige tal fra fordelingen (Forelæsning 10).
Eksempel: P (X ≤ 2), X ∼ Exp(3)pexp(2,1/3)
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 36 / 37
R (R Note afsnit 5 )
Oversigt
1 Intro2 Eksponential fordelingen
Eksempel 1Eksempel 2Eksempel 3
3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8
4 Transformationer5 Normalplot6 R (R Note afsnit 5 )
Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 37 / 37