50
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010 Danmarks Tekniske Universitet 2800 Lyngby – Danmark e-mail: [email protected] Efter˚ ar 2020 DTU Compute Introduktion til Statistik Efter˚ ar 2020 1 / 54

Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Introduktion til Statistik

Forelæsning 3: Kontinuerte fordelinger

Peder Bacher

DTU Compute, Dynamiske SystemerBygning 303B, Rum 010Danmarks Tekniske Universitet2800 Lyngby – Danmarke-mail: [email protected]

Efterar 2020

DTU Compute Introduktion til Statistik Efterar 2020 1 / 54

Page 2: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kapitel 2: Kontinuerte fordelinger

Grundlæggende koncepter:

Tæthedsfunktion: f (x) (pdf)

Fordelingsfunktion: F(x) = P(X ≤ x) (cdf)

Middelværdi (µ) og varians (σ2)

Regneregler for stokastiske variabler (lineære funktioner)

Specifikke fordelinger:

Uniform

Normal

Log-Normal

Eksponential

Funktioner af normalfordeling (afsn. 2.10) (introduceres først i de næste uger):

t-fordelingen, χ2-fordelingen (Chi-i-anden) og F-fordelingen

DTU Compute Introduktion til Statistik Efterar 2020 2 / 54

Page 3: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Chapter 2: Continuous Distributions

General concepts:

Density function: f (x) (pdf)

Distribution: F(x) = P(X ≤ x) (cdf)

Mean (µ) and variance (σ2)

Calculation rules for random variables (linear functions)

Specific distributions:

Uniform

Normal

Log-Normal

Exponential

Funktions of normaldist. (Sec. 2.10) (introduced in the coming weeks):

t-distribution, χ2-distribution (Chi-square) og F-distribution

DTU Compute Introduktion til Statistik Efterar 2020 3 / 54

Page 4: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Oversigt

1 Kontinuerte Stokastiske variable og fordelingerTæthedsfunktionFordelingsfunktionMiddelværdi af en kontinuert stokastisk variabelVarians af en kontinuert stokastisk variabel

2 Konkrete Statistiske fordelingerKontinuerte fordelinger i RUniform fordelingNormalfordelingenLog-Normalfordelingen

3 Eksponentialfordelingen

4 Regneregler for middelværdi og varians

DTU Compute Introduktion til Statistik Efterar 2020 4 / 54

Page 5: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksempel: Population og fordeling

DTU Compute Introduktion til Statistik Efterar 2020 5 / 54

Tilfældigtudvalgt

(Uendelig) Population

Stikprøvegennemsnitx

Middelværdiµ

Stikprøve{x1 ,x2, . . . ,xn}

Statistiskinferens

150 160 170 180 190 200 210

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

Højde x

thed

µ

Reprœsenter populationen med fordeling

Stikprøvens empiriske fordeling

Højde x

Fre

kven

s

150 160 170 180 190 200 2100.

000.

010.

020.

030.

04

x

Page 6: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion

Tæthedsfunktion (probability density function (pdf))

Tæthedsfunktionen for en stokastisk variabel betegnes ved f (x)

For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs.f (x) 6= P(X = x)

Et godt plot af f (x) er et histogram (kontinuert)

DTU Compute Introduktion til Statistik Efterar 2020 7 / 54

Page 7: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion

Tæthedsfunktion for en kontinuert variabel

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

P(a < X ≤ b)

a b

DTU Compute Introduktion til Statistik Efterar 2020 8 / 54

Page 8: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion

Tæthedsfunktion for en kontinuert variabel

Der gælder:

Ingen negative værdier

f (x)≥ 0 for alle mulige x

Areal under kurven er een ∫∞

−∞

f (x)dx = 1

DTU Compute Introduktion til Statistik Efterar 2020 9 / 54

Page 9: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion

Fordelingsfunktion (distribution function ellercumulative density function (cdf))

Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved

F(x)

Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion ved

F(x) = P(X ≤ x)

F(x) =∫ x

−∞

f (u)du

f (x) = F′(x)

DTU Compute Introduktion til Statistik Efterar 2020 10 / 54

Page 10: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion

Fordelingsfunktion (distribution function ellercumulative density function (cdf))

-4 -2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x)

P(a

<X≤

b)=

F(b)−

F(a)

a b

DTU Compute Introduktion til Statistik Efterar 2020 11 / 54

Page 11: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion

Spørgsmal om sandsynligheder (socrative.com, room: PBAC)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

P(a < X ≤ b)

a b

Hvilket udtryk giver den markerede sandsynlighed? (arealet)

A:∫ b−∞

f (x)dx B: 1− ∫ ba f (x)dx C:

∫ ba f (x)dx D: 1− ∫ ∞

a f (x)dx

Svar C:∫ b

a f (x)dx

DTU Compute Introduktion til Statistik Efterar 2020 12 / 54

Page 12: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion

Spørgsmal om sandsynligheder (socrative.com, room: PBAC)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

P(a < X ≤ b)

a b

Hvordan kan vi nemmest udregne den markerede sandsynlighed?

A:∫ b

a f (x)dx B:∫ b

a F(x)dx C: f (b)− f (a) D: F(b)−F(a)

Svar D: F(b)−F(a) (vi gør det i R med (normalfordelt): pnorm(b) - pnorm(a))

DTU Compute Introduktion til Statistik Efterar 2020 13 / 54

Page 13: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel

Middelværdi (mean) af en kontinuert stokastisk variabel

Middelværdien af en kontinuert stokastisk variabel

µ =∫

−∞

x · f (x)dx

Sammenlign med den diskrete definition: µ = ∑alle x x · f (x)

DTU Compute Introduktion til Statistik Efterar 2020 14 / 54

Page 14: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel

Varians af en kontinuert stokastisk variabel

Variansen af en kontinuert stokastisk variabel:

σ2 =∫

−∞

(x−µ)2 · f (x)dx

Sammenlign med den diskrete definition: σ2 = ∑alle x(x−µ)2 · f (x)

DTU Compute Introduktion til Statistik Efterar 2020 15 / 54

Page 15: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel

Spørgsmal om middelværdi (socrative.com, room: PBAC)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

x

f(x)

f1(x)

f2(x)

Hvilken pdf har størst middelværdi (begge er symmetriske)?

A: µ1 < µ2 B: µ1 > µ2 C: µ1 = µ2 D: Kan ikke afgøres

Svar A: µ1 < µ2.

DTU Compute Introduktion til Statistik Efterar 2020 16 / 54

Page 16: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel

Spørgsmal om spredning (socrative.com, room: PBAC)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

x

f(x)

f1(x)

f2(x)

Hvilken pdf har størst standard afvigelse (begge er symmetriske)?

A: σ1 < σ2 B: σ1 > σ2 C: σ1 = σ2 D: Kan ikke afgøres

Svar B: σ1 > σ2 (umiddelbart). Svar D, ogsa fint, da man ikke kan se hvad der erudenfor plottet.

DTU Compute Introduktion til Statistik Efterar 2020 17 / 54

Page 17: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger

Konkrete statistiske fordelinger

Der findes en række statistiske fordelinger, som kan bruges til at beskrive oganalysere forskellige problemstillinger med

Følgende kontinuerte fordelinger:

Uniform fordelingNormalfordelingenLog-normalfordelingenEksponentialfordelingen

DTU Compute Introduktion til Statistik Efterar 2020 19 / 54

Page 18: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Kontinuerte fordelinger i R

Kontinuerte fordelinger i R

R Betegnelsenorm Normalfordelingenunif Uniform fordelinglnorm Log-normalfordelingenexp Eksponentialfordelingen

d Tæthedsfunktion f (x) (probability density function).

p Fordelingsfunktion F(x) (cumulative distribution function).

q Fraktil (quantile) i fordeling.r Tilfældige tal fra fordelingen.

DTU Compute Introduktion til Statistik Efterar 2020 20 / 54

Page 19: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Uniform fordeling

Uniform fordeling

Skrivemade:

X ∼ U(α,β ) (Læses: X følger en uniform fordeling med parametre α og β )

Tæthedsfunktion:

f (x) = 1β−α

Middelværdi:

µ = α+β2

Varians:

σ2 = 112 (β −α)2

DTU Compute Introduktion til Statistik Efterar 2020 21 / 54

Page 20: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Uniform fordeling

Eksempel: Uniform fordeling

3.5 4 4.5 5 5.50

0.2

0.4

0.6

0.8

1

x

Tae

thed

, f(x

)Uniform fordeling U(4,5)

DTU Compute Introduktion til Statistik Efterar 2020 22 / 54

Page 21: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Uniform fordeling

Spørgsmal: Uniform fordeling (socrative.com, room: PBAC)

Medarbejdere pa en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Detantages, at ankomsttiden kan beskrives ved en uniform fordeling.

Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommermellem 8:20 og 8:30?

A: 1/2 B: 1/6 C: 1/3 D: 0

Svar C: 10/30=1/3

punif(30,0,30) - punif(20,0,30)

[1] 0.33

DTU Compute Introduktion til Statistik Efterar 2020 23 / 54

Page 22: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Uniform fordeling

Spørgsmal: Uniform fordeling (socrative.com, room: PBAC)

Medarbejdere pa en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Detantages, at ankomsttiden kan beskrives ved en uniform fordeling.

Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommer efter8:30?

A: 1/2 B: 1/6 C: 1/3 D: 0

Svar: P(X > 30) = 0

1 - punif(30,0,30)

[1] 0

DTU Compute Introduktion til Statistik Efterar 2020 24 / 54

Page 23: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Normalfordelingen

Skrivemade:

X ∼ N(µ,σ2)

Tæthedsfunktion:

f (x) = 1σ√

2πe−

(x−µ)2

2σ2

Middelværdi:

µ = µ

Varians:

σ2 = σ2

DTU Compute Introduktion til Statistik Efterar 2020 25 / 54

Page 24: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordelingen

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5Normalfordeling

x

Tae

thed

, f(x

)

DTU Compute Introduktion til Statistik Efterar 2020 26 / 54

Page 25: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordelingen

−5 0 5 10−0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45N(0,12) N(5,12)

Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians

DTU Compute Introduktion til Statistik Efterar 2020 27 / 54

Page 26: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordelingen

−10 −8 −6 −4 −2 0 2 4 6 8 10

0

0.1

0.2

0.3

0.4

0.5

Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians

x

Tae

thed

, f(x

)

DTU Compute Introduktion til Statistik Efterar 2020 28 / 54

Page 27: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordeling, sandsynligheder

Fordeling af vægt af rugbrød:

Antag at vægten af et rugbrød fra en produktionslinie kan beskrives med ennormalfordeling

X ∼ N(500,102)

dvs. middelværdi µ = 500 gram og standardafvigelse σ = 10 gram.Vi vil male vægten af et tilfældigt udvalgt brød.

Spørgsmal:

1: Hvad er sandsynligheden for at brødet vejer under 490 g?2: Hvad er sandsynligheden for at brødet vejer mere en 20 g forskelligt fra 500 g?

DTU Compute Introduktion til Statistik Efterar 2020 29 / 54

Page 28: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordeling, spørgsmal 1

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

1: Hvad er sandsynligheden for at brødet vejer under 490 g?

Svar: P(X ≤ 490) = F(490) = 0.16

pnorm(490, mean=500, sd=10)

DTU Compute Introduktion til Statistik Efterar 2020 30 / 54

Page 29: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordeling, spørgsmal 2

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

1: Hvad er sandsynligheden for at brødet vejer mere end 20 g forskelligt fra 500 g?

Svar: P(X ≤ 480∨X > 520) = 2 ·P(X ≤ 480) = 2 ·F(480) = 0.046

2 * pnorm(480, mean=500, sd=10)

DTU Compute Introduktion til Statistik Efterar 2020 31 / 54

Page 30: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Spørgsmal: Sandsynlighed i normalfordeling

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

Hvad er sandsynligheden for at rugbrødet vejer over 510 g?

A: F(510) B: 1−F(490) C: 1−F(520) D: 1−F(510)

Svar: P(X > 510) = 1−P(X ≤ 510) = 0.16

DTU Compute Introduktion til Statistik Efterar 2020 32 / 54

Page 31: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Normalfordeling fraktiler

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

95%

? ?

“Omvendt spørgsmal”: Hvilket interval, symmetrisk om midten, dækker 95% afrugbrødene?

qnorm(c(0.025,0.975), mean=500, sd=10)

[1] 480.4 519.6DTU Compute Introduktion til Statistik Efterar 2020 33 / 54

Page 32: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Standard normalfordelingen

En standard normalfordeling

Z ∼ N(0,12)

En normalfordeling med middelværdi 0 og varians 1.

Standardisering

En vilkarlig normalfordelt variabel X ∼ N(µ,σ2) kan standardiseres ved at beregne

Z =X−µ

σ

DTU Compute Introduktion til Statistik Efterar 2020 34 / 54

Page 33: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Standard Normalfordeling

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

z er standardiseret vægt af et rugbrød (x-akse er i std. afvigelse)

f(z)

Z = X−µσ

Z ∼ N(0,12)

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x er vægt af et rugbrød

f(x)

X ∼ N(500,102)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

z er standardiseret vægt af et rugbrød (x-akse er i std. afvigelse)

f(z)

Z = X−µσ

Z ∼ N(0,12)

1: Hvad er sandsynligheden for at brødet vejer under 490 gram?

Svar: P(X ≤ 490) = P(Z ≤ 490−50010 ) = P(Z ≤−1) = 0.16

pnorm(-1)

DTU Compute Introduktion til Statistik Efterar 2020 35 / 54

Page 34: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Transformation til standard normalfordeling

0 100 200 300 400 500 600

0.0

0.1

0.2

0.3

0.4

X ∼ N(500,102)

Z = X−µσ = X−500

10 ∼ N(0,12)

DTU Compute Introduktion til Statistik Efterar 2020 36 / 54

Page 35: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Normalfordelingen

Eksempel: Transformation til standard normalfordeling

-10 -5 0 5 10

0.00

0.05

0.10

0.15

0.20

x

f(x)

A

460 480 500 520 540

0.00

0.01

0.02

0.03

0.04

x

f(x)

B

-200 -160 -1200.00

0.02

0.04

0.06

0.08

x

f(x)

C

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

f(x)

D

1: Hvilken af disse er standard normalfordelingens pdf?

Svar: D, for ca. µ±3σ er f (x)≈ 0 for Z ∼ N(0,12).

DTU Compute Introduktion til Statistik Efterar 2020 37 / 54

Page 36: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Log-Normalfordelingen

Log-Normalfordelingen

Skrivemade:

X ∼ LN(α,β 2) (Hvis X følger log-normal sa følger ln(X) normal)

Tæthedsfunktion:

f (x) =

{1

x√

2πβe−(ln(x)−α)2/2β 2

x > 0, β > 00 ellers

Middelværdi:

µ = eα+β 2/2

Varians:

σ2 = e2α+β 2(eβ 2 −1)

DTU Compute Introduktion til Statistik Efterar 2020 38 / 54

Page 37: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Log-Normalfordelingen

Eksempel: Log-normalfordelingen

0 5 10 15 20 25 300

0.05

0.1

0.15

0.2

0.25

LN(1,1)

x

Tae

thed

, f(x

)Log−Normalfordeling LN(1,1)

DTU Compute Introduktion til Statistik Efterar 2020 39 / 54

Page 38: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Konkrete Statistiske fordelinger Log-Normalfordelingen

Log-normalfordelingen

Lognormal og Normalfordelingen:

En log-normalfordelt variabel Y ∼ LN(α,β 2), kan transformeres til en standardnormalfordelt variabel Z ved

Z =ln(Y)−α

βdvs.

Z ∼ N(0,12)

DTU Compute Introduktion til Statistik Efterar 2020 40 / 54

Page 39: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksponentialfordelingen

Eksponentialfordelingen

Skrivemade:

X ∼ Exp(λ )

Tæthedsfunktionen

f (x) ={

λe−λx x > 00 ellers

Middelværdi

µ = 1λ

Varians

σ2 = 1λ 2

DTU Compute Introduktion til Statistik Efterar 2020 42 / 54

Page 40: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksponentialfordelingen

Eksempel: Eksponentialfordelingen

−1 0 1 2 3 4 5 6 7 8 9 100

0.2

0.4

0.6

0.8

1

EXP(1)

x

Tae

thed

, f(x

)Eksponential fordeling med β=1

DTU Compute Introduktion til Statistik Efterar 2020 43 / 54

Page 41: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksponentialfordelingen

Eksponentialfordelingen

Eksponentialfordelingen er et special tilfælde af Gammafordelingen

Eksponentialfordelingen anvendes f.eks. til at beskrive levetider og ventetider

Eksponentialfordelingen kan bruges til at beskrive (vente)tiden mellemhændelser i poissonproces

DTU Compute Introduktion til Statistik Efterar 2020 44 / 54

Page 42: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksponentialfordelingen

Sammenhæng mellem eksponential- og poissonfordelingen

tid t∗ ∗ ∗ ∗ ∗ ∗ ∗

t1 t2

Poisson: Diskrete hændelser pr. enhed

Eksponential: Kontinuert afstand mellem hændelser

DTU Compute Introduktion til Statistik Efterar 2020 45 / 54

Page 43: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Eksponentialfordelingen

Eksempel: Eksponentielfordeling

Kø-model - poissonproces

Tiden mellem kundeankomster pa et posthus er eksponentialfordelt medmiddelværdi µ = 2 minutter, dvs. λ = 1

µ = 12

1min (skaleret λ2min = 1 1

2min ).

Spørgsmal:

En kunde er netop ankommet. Beregn sandsynligheden for at der ikke kommerflere kunder indefor en periode pa 2 minutter vha. poissonfordelingen

Svar:

Med Poissonfordelingen (periodelængden skal svare til spørgsmalet, brug λ2min):

dpois(x=0, lambda=1)

Brug Eksponentialfordeling (Xexp ∼ Exp(λ ) med λ = 12

1min , find P(Xexp > 2)):

1-pexp(q=2, rate=1/2)

Giver 0.37

DTU Compute Introduktion til Statistik Efterar 2020 46 / 54

Page 44: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Regneregler for lineær funktion af et X

Hvis:

X er en stokastisk variabel

Vi antager at a og b er konstanter

Da gælder (gælder BADE kontinuert og diskret):

Middelværdi-regel:

E(aX+b) = aE(X)+b

Varians-regel:

V(aX+b) = a2 V(X)

DTU Compute Introduktion til Statistik Efterar 2020 48 / 54

Page 45: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Eksempel: Regneregler for lineær funktion af et X

X er en stokastisk variabel

En stokastisk variabel X har middelværdi 4 og varians 6.

Spørgsmal:

Beregn middelværdi og varians for Y =−3X+2

Svar:

E(Y) = E(−3X+2) =−3E(X)+2 =−3 ·4+2 =−10

V(Y) = V(−3X+2) = (−3)2 V(X) = 9 ·6 = 54

DTU Compute Introduktion til Statistik Efterar 2020 49 / 54

Page 46: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Regneregler for lineær funktion af flere Xer

Hvis:

X1, . . . ,Xn er stokastiske variable

Da gælder (nar de er uafhængige) (gælder BADE kontinuert og diskret):

Middelværdi-regel:

E(a1X1 +a2X2 + . . .+anXn) = a1 E(X1)+a2E(X2)+ . . .+anE(Xn)

Varians-regel:

V(a1X1 +a2X2 + . . .+anXn) = a21 V(X1)+a2

2 V(X2)+ . . .+a2n V(Xn)

DTU Compute Introduktion til Statistik Efterar 2020 50 / 54

Page 47: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Eksempel: Regneregler for lineær funktion af flere Xer

Flypassager-planlægning

Vægten af een passagerer pa fly pa en strækning antages normalfordeltX ∼ N(70,102).

Et fly, der kan tage 55 passagerer, ma max. lastes med 4000 kg (kun passageresvægt betragtes som last).

Spørgsmal:

Beregn sandsynligheden for at flyet bliver overlastet.

Hvad er den samlede passagervægt Y pa en afgang?

A: Y = 55 ·X B: Y = ∑55i=1 Xi C: Y = 55+X D: Ej A,B eller C

Svar B: Y = ∑55i=1 Xi, det er summen af 55 forskellige passagerer.

DTU Compute Introduktion til Statistik Efterar 2020 51 / 54

Page 48: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Eksempel: Regneregler 3

Hvad er den samlede passagervægt Y pa en afgang?

Y = ∑55i=1 Xi, hvor Xi ∼ N(70,102)

Middelværdi og varians for Y:

E(Y) =55

∑i=1

E(Xi) =55

∑i=1

70 = 55 ·70 = 3850

V(Y) =55

∑i=1

V(Xi) =55

∑i=1

100 = 55 ·100 = 5500

Bruger normalfordeling for Y:

1-pnorm(4000, mean = 3850, sd = sqrt(5500))

[1] 0.022

DTU Compute Introduktion til Statistik Efterar 2020 52 / 54

Page 49: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Eksempel: Regneregler 3 - FORKERT ANALYSE

Hvad er Y?

I hvert fald IKKE: Y = 55 ·X !!!!!!

Middelværdi og varians for Y:

E(Y) = 55 ·70 = 3850

V(Y) = 552 V(X) = 552 ·100 = 5502 = 302500

Bruger normalfordeling for Y:

1-pnorm(4000, mean = 3850, sd = 550)

[1] 0.39

Konsekvens af forkert beregning:

MANGE spildte penge for flyselskabet!!!

DTU Compute Introduktion til Statistik Efterar 2020 53 / 54

Page 50: Introduktion til Statistik - compute.dtu.dk · Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 010

Regneregler for middelværdi og varians

Lineær kombination af normalfordelte stokastiske variablerer ogsa normalfordelt

Lineær kombination af normalfordelte stokastiske variabler er ogsanormalfordelt

Theorem 2.40: Let X1, . . . ,Xn be independent normal random variables, thenany linear combination of X1, . . . ,Xn will follow a normal distribution, withmean and variance given in Theorem 2.56.

DTU Compute Introduktion til Statistik Efterar 2020 54 / 54