37
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby – Danmark e-mail: [email protected] Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 1 / 37

Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Kursus 02402Introduktion til Statistik

Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Per Bruun Brockhoff

DTU Compute, Statistik og DataanalyseBygning 324, Rum 220Danmarks Tekniske Universitet2800 Lyngby – Danmark

e-mail: [email protected]

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 1 / 37

Page 2: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 2 / 37

Page 3: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Intro

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 3 / 37

Page 4: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Intro

Nogle anvendte fordelinger

(Både kontinuerte og diskerete)Diskrete:

Binomial fordelingenDen hypergeometriske fordelingPoisson fordelingen

Kontinuerte:Normal fordelingenLog-Normal fordelingenUniform fordelingenEksponential fordelingen

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 4 / 37

Page 5: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 5 / 37

Page 6: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen

Eksponential fordelingen

f(x) =

{ 1βe−x/β x > 0, β > 0

0 ellers

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 6 / 37

Page 7: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen

Eksponentialfordelingen

Eksponential fordelingen er et special tilfælde afGamma fordelingenEksponential fordelingen anvendes f.eks. til at beskrivelevetider og ventetiderEksponential fordelingen kan bruges til at beskrive(vente)tiden mellem hændelser i poisson fordelingenMiddelværdi µ = β

Varians σ2 = β2

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 7 / 37

Page 8: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen

Sammenhæng mellem Eksponential og Poisson fordelingen

tid t∗ ∗ ∗ ∗ ∗ ∗ ∗

t1 t2

Poisson: Diskrete hændelser pr. enhed

Eksponential: Kontinuert afstand mellem hændelser

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 8 / 37

Page 9: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen

Eksponential fordelingen

−1 0 1 2 3 4 5 6 7 8 9 100

0.2

0.4

0.6

0.8

1

EXP(1)

x

Tae

thed

, f(x

)

Eksponential fordeling med β=1

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 9 / 37

Page 10: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen Eksempel 1

Eksempel 1

Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter.

En kunde er netop ankommet. Hvad er sandsynligheden forat der ikke kommer flere kunder indefor en periode på 2minutter?

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 10 / 37

Page 11: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen Eksempel 1

Eksempel 1

0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

0.5

exp(2)

x

tæth

ed

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 11 / 37

Page 12: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen Eksempel 2

Eksempel 2

Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter.

En kunde er netop ankommet. Beregn sandsynligheden forat der ikke kommer flere kunder indefor en periode på 2minutter vha. Poissonfordelingen

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 12 / 37

Page 13: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen Eksempel 3

Eksempel 3

Tiden mellem kundeankomster på et posthus ereksponential fordelt med middelværdi µ = 2 minutter. Vibetragter nu en periode på 10 minutter

Beregn sandynligheden for at der ikke kommer nogenkunder i perioden vha. Poissonfordelingen

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 13 / 37

Page 14: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Eksponential fordelingen Eksempel 3

Eksempel 3

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 14 / 37

Page 15: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 15 / 37

Page 16: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable

Regneregler for stokastiske variable

(Gælder BÅDE kontinuert og diskret)Vi antager at a og b er konstanter og X er en stokastiskvariabel. Da gælder

E(aX + b) = aE(X) + b

V ar(aX + b) = a2V ar(X)

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 16 / 37

Page 17: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 4

Eksempel 4

En stokastisk variabel X har middelværdi 4 og varians 6.

Beregn middelværdi og varians for Y = −3X + 2

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 17 / 37

Page 18: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 4

Regneregler for stokastiske variable

Følgende linear kombinationer gælder:

E(a1X1 + a2X2 + ..+ anXn)

= a1E(X1) + a2E(X2) + ..+ anE(Xn)

V ar(a1X1 + a2X2 + ..+ anXn)

= a21V ar(X1) + ..+ a2nV ar(Xn)

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 18 / 37

Page 19: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 5

Eksempel 5

Vægten af passagerer på en flystrækning antagesnormalfordelt X ∼ N(70, 102).

Et fly, der kan tage 55 passagerer, må max. lastes med4000 kg (kun passageres vægt betragtes som last).

Beregn sandsynligheden for at flyet bliver overlastetPer Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 19 / 37

Page 20: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 5

Eksempel 5

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 20 / 37

Page 21: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 6

Eksempel 6

En færge medtager X passagerer. Det oplyses, atE[X] = 400 og V ar[X] = 402 og at X er normalfordelt.

Færgeselskabet har en fortjeneste på 120 kr. pr. passager

Beregn middelværdi og varians for færgeselskabetsfortjeneste, og beregn sandsynligheden for at fortjenestenvil overstige 50.000 kr.

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 21 / 37

Page 22: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 6

Eksempel 6

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 22 / 37

Page 23: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 7

Eksempel 7

Antag, at æg sælges i pakker á 144 æg. Sandsynlighedenfor at et tilfældig udvalgt æg er salmonella inficeret antagesat være 5%.

Et firma, der producerer fødevarer, indkøber nu 100 pakkeræg.

Hvad bliver middelværdi og varians af antal salmonellainficerede æg i den samlede forsendelse?

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 23 / 37

Page 24: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 7

Eksempel 7

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 24 / 37

Page 25: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Regneregler for stokastiske variable Eksempel 8

Eksempel 8

Antag, at du vil købe noget sand, da du vil lave en nyindkørsel til dit hus. Det er specielt vigtigt for dig, at derikke er sten blandet i sandet. Producenten lover, at der igennemsnit kun er 0.5 sten pr. m3.

Du køber nu 10 m3 sand og erfarer, at der er 11 sten iblandingen. Føler du dig snydt af producentens løfte om atder kun er 0.5 sten pr. m3 ?

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 25 / 37

Page 26: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 26 / 37

Page 27: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Transformationer

Såfremt data afviger fra at være normal fordelt, kan manofte med fordel transformere data, således at detransformerede data kan antages at være normal fordelt.

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 27 / 37

Page 28: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Transformationer - Før

0 10 20 30 40 50 60 700

5

10

15

20

25

30

35

40

45

50

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 28 / 37

Page 29: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Transformationer - Efter

−0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.50

5

10

15

20

25

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 29 / 37

Page 30: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Hyppigt anvendte transformationer

Gør store værdier mindre:− 1

xln xx1/4√x

Gør store værdier større:x2

x3

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 30 / 37

Page 31: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Transformationer

Transformationer

Ofte vil man udføre statistiske analyser på detransformerede data, såfremt det viser sig, at detransformerede data er ’pænere’, f.eks. mere symmetriske.

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 31 / 37

Page 32: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Normalplot

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 32 / 37

Page 33: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Normalplot

Normalplot

Man kan kontrollere/undersøg om data ser ud til at værenormalfordelt:

Plotte histogramLave box plotsLave et normalplot:

En direkte sammenligning med normalfordelingen

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 33 / 37

Page 34: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

Normalplot

Normalplot

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 34 / 37

Page 35: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

R (R Note afsnit 5 )

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 35 / 37

Page 36: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

R (R Note afsnit 5 )

R (R note 5) R Betegnelsenorm Normalfordelingenunif Den uniforme fordelinglnorm Log-normalfordelingenexp Exponentialfordelingen

d Tæthedsfunktion f(x) (probability distribution).p Fordelingsfunktion F (x) (cumulative distributionfunction).

q Fraktil (quantile) i fordeling.r Tilfældige tal fra fordelingen (Forelæsning 10).

Eksempel: P (X ≤ 2), X ∼ Exp(3)pexp(2,1/3)

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 36 / 37

Page 37: Kursus02402 IntroduktiontilStatistik Forelæsning4 ... fileEksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 Transformationer

R (R Note afsnit 5 )

Oversigt

1 Intro2 Eksponential fordelingen

Eksempel 1Eksempel 2Eksempel 3

3 Regneregler for stokastiske variableEksempel 4Eksempel 5Eksempel 6Eksempel 7Eksempel 8

4 Transformationer5 Normalplot6 R (R Note afsnit 5 )

Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 4 Foråret 2014 37 / 37