Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Introduktion til Statistik
Forelæsning 3: Kontinuerte fordelinger
Peder Bacher
DTU Compute, Dynamiske SystemerBygning 303B, Rum 010Danmarks Tekniske Universitet2800 Lyngby – Danmarke-mail: [email protected]
Efterar 2020
DTU Compute Introduktion til Statistik Efterar 2020 1 / 54
Kapitel 2: Kontinuerte fordelinger
Grundlæggende koncepter:
Tæthedsfunktion: f (x) (pdf)
Fordelingsfunktion: F(x) = P(X ≤ x) (cdf)
Middelværdi (µ) og varians (σ2)
Regneregler for stokastiske variabler (lineære funktioner)
Specifikke fordelinger:
Uniform
Normal
Log-Normal
Eksponential
Funktioner af normalfordeling (afsn. 2.10) (introduceres først i de næste uger):
t-fordelingen, χ2-fordelingen (Chi-i-anden) og F-fordelingen
DTU Compute Introduktion til Statistik Efterar 2020 2 / 54
Chapter 2: Continuous Distributions
General concepts:
Density function: f (x) (pdf)
Distribution: F(x) = P(X ≤ x) (cdf)
Mean (µ) and variance (σ2)
Calculation rules for random variables (linear functions)
Specific distributions:
Uniform
Normal
Log-Normal
Exponential
Funktions of normaldist. (Sec. 2.10) (introduced in the coming weeks):
t-distribution, χ2-distribution (Chi-square) og F-distribution
DTU Compute Introduktion til Statistik Efterar 2020 3 / 54
Oversigt
1 Kontinuerte Stokastiske variable og fordelingerTæthedsfunktionFordelingsfunktionMiddelværdi af en kontinuert stokastisk variabelVarians af en kontinuert stokastisk variabel
2 Konkrete Statistiske fordelingerKontinuerte fordelinger i RUniform fordelingNormalfordelingenLog-Normalfordelingen
3 Eksponentialfordelingen
4 Regneregler for middelværdi og varians
DTU Compute Introduktion til Statistik Efterar 2020 4 / 54
Eksempel: Population og fordeling
DTU Compute Introduktion til Statistik Efterar 2020 5 / 54
Tilfældigtudvalgt
(Uendelig) Population
Stikprøvegennemsnitx
Middelværdiµ
Stikprøve{x1 ,x2, . . . ,xn}
Statistiskinferens
150 160 170 180 190 200 210
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
Højde x
Tæ
thed
µ
Reprœsenter populationen med fordeling
Stikprøvens empiriske fordeling
Højde x
Fre
kven
s
150 160 170 180 190 200 2100.
000.
010.
020.
030.
04
x
Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion
Tæthedsfunktion (probability density function (pdf))
Tæthedsfunktionen for en stokastisk variabel betegnes ved f (x)
For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs.f (x) 6= P(X = x)
Et godt plot af f (x) er et histogram (kontinuert)
DTU Compute Introduktion til Statistik Efterar 2020 7 / 54
Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion
Tæthedsfunktion for en kontinuert variabel
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
f(x)
P(a < X ≤ b)
a b
DTU Compute Introduktion til Statistik Efterar 2020 8 / 54
Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion
Tæthedsfunktion for en kontinuert variabel
Der gælder:
Ingen negative værdier
f (x)≥ 0 for alle mulige x
Areal under kurven er een ∫∞
−∞
f (x)dx = 1
DTU Compute Introduktion til Statistik Efterar 2020 9 / 54
Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion
Fordelingsfunktion (distribution function ellercumulative density function (cdf))
Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved
F(x)
Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion ved
F(x) = P(X ≤ x)
F(x) =∫ x
−∞
f (u)du
f (x) = F′(x)
DTU Compute Introduktion til Statistik Efterar 2020 10 / 54
Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion
Fordelingsfunktion (distribution function ellercumulative density function (cdf))
-4 -2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
x
F(x)
P(a
<X≤
b)=
F(b)−
F(a)
a b
DTU Compute Introduktion til Statistik Efterar 2020 11 / 54
Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion
Spørgsmal om sandsynligheder (socrative.com, room: PBAC)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
f(x)
P(a < X ≤ b)
a b
Hvilket udtryk giver den markerede sandsynlighed? (arealet)
A:∫ b−∞
f (x)dx B: 1− ∫ ba f (x)dx C:
∫ ba f (x)dx D: 1− ∫ ∞
a f (x)dx
Svar C:∫ b
a f (x)dx
DTU Compute Introduktion til Statistik Efterar 2020 12 / 54
Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion
Spørgsmal om sandsynligheder (socrative.com, room: PBAC)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
f(x)
P(a < X ≤ b)
a b
Hvordan kan vi nemmest udregne den markerede sandsynlighed?
A:∫ b
a f (x)dx B:∫ b
a F(x)dx C: f (b)− f (a) D: F(b)−F(a)
Svar D: F(b)−F(a) (vi gør det i R med (normalfordelt): pnorm(b) - pnorm(a))
DTU Compute Introduktion til Statistik Efterar 2020 13 / 54
Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel
Middelværdi (mean) af en kontinuert stokastisk variabel
Middelværdien af en kontinuert stokastisk variabel
µ =∫
∞
−∞
x · f (x)dx
Sammenlign med den diskrete definition: µ = ∑alle x x · f (x)
DTU Compute Introduktion til Statistik Efterar 2020 14 / 54
Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Variansen af en kontinuert stokastisk variabel:
σ2 =∫
∞
−∞
(x−µ)2 · f (x)dx
Sammenlign med den diskrete definition: σ2 = ∑alle x(x−µ)2 · f (x)
DTU Compute Introduktion til Statistik Efterar 2020 15 / 54
Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel
Spørgsmal om middelværdi (socrative.com, room: PBAC)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
x
f(x)
f1(x)
f2(x)
Hvilken pdf har størst middelværdi (begge er symmetriske)?
A: µ1 < µ2 B: µ1 > µ2 C: µ1 = µ2 D: Kan ikke afgøres
Svar A: µ1 < µ2.
DTU Compute Introduktion til Statistik Efterar 2020 16 / 54
Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel
Spørgsmal om spredning (socrative.com, room: PBAC)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
x
f(x)
f1(x)
f2(x)
Hvilken pdf har størst standard afvigelse (begge er symmetriske)?
A: σ1 < σ2 B: σ1 > σ2 C: σ1 = σ2 D: Kan ikke afgøres
Svar B: σ1 > σ2 (umiddelbart). Svar D, ogsa fint, da man ikke kan se hvad der erudenfor plottet.
DTU Compute Introduktion til Statistik Efterar 2020 17 / 54
Konkrete Statistiske fordelinger
Konkrete statistiske fordelinger
Der findes en række statistiske fordelinger, som kan bruges til at beskrive oganalysere forskellige problemstillinger med
Følgende kontinuerte fordelinger:
Uniform fordelingNormalfordelingenLog-normalfordelingenEksponentialfordelingen
DTU Compute Introduktion til Statistik Efterar 2020 19 / 54
Konkrete Statistiske fordelinger Kontinuerte fordelinger i R
Kontinuerte fordelinger i R
R Betegnelsenorm Normalfordelingenunif Uniform fordelinglnorm Log-normalfordelingenexp Eksponentialfordelingen
d Tæthedsfunktion f (x) (probability density function).
p Fordelingsfunktion F(x) (cumulative distribution function).
q Fraktil (quantile) i fordeling.r Tilfældige tal fra fordelingen.
DTU Compute Introduktion til Statistik Efterar 2020 20 / 54
Konkrete Statistiske fordelinger Uniform fordeling
Uniform fordeling
Skrivemade:
X ∼ U(α,β ) (Læses: X følger en uniform fordeling med parametre α og β )
Tæthedsfunktion:
f (x) = 1β−α
Middelværdi:
µ = α+β2
Varians:
σ2 = 112 (β −α)2
DTU Compute Introduktion til Statistik Efterar 2020 21 / 54
Konkrete Statistiske fordelinger Uniform fordeling
Eksempel: Uniform fordeling
3.5 4 4.5 5 5.50
0.2
0.4
0.6
0.8
1
x
Tae
thed
, f(x
)Uniform fordeling U(4,5)
DTU Compute Introduktion til Statistik Efterar 2020 22 / 54
Konkrete Statistiske fordelinger Uniform fordeling
Spørgsmal: Uniform fordeling (socrative.com, room: PBAC)
Medarbejdere pa en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Detantages, at ankomsttiden kan beskrives ved en uniform fordeling.
Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommermellem 8:20 og 8:30?
A: 1/2 B: 1/6 C: 1/3 D: 0
Svar C: 10/30=1/3
punif(30,0,30) - punif(20,0,30)
[1] 0.33
DTU Compute Introduktion til Statistik Efterar 2020 23 / 54
Konkrete Statistiske fordelinger Uniform fordeling
Spørgsmal: Uniform fordeling (socrative.com, room: PBAC)
Medarbejdere pa en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Detantages, at ankomsttiden kan beskrives ved en uniform fordeling.
Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommer efter8:30?
A: 1/2 B: 1/6 C: 1/3 D: 0
Svar: P(X > 30) = 0
1 - punif(30,0,30)
[1] 0
DTU Compute Introduktion til Statistik Efterar 2020 24 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Normalfordelingen
Skrivemade:
X ∼ N(µ,σ2)
Tæthedsfunktion:
f (x) = 1σ√
2πe−
(x−µ)2
2σ2
Middelværdi:
µ = µ
Varians:
σ2 = σ2
DTU Compute Introduktion til Statistik Efterar 2020 25 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordelingen
−5 −4 −3 −2 −1 0 1 2 3 4 50
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5Normalfordeling
x
Tae
thed
, f(x
)
DTU Compute Introduktion til Statistik Efterar 2020 26 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordelingen
−5 0 5 10−0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45N(0,12) N(5,12)
Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians
DTU Compute Introduktion til Statistik Efterar 2020 27 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordelingen
−10 −8 −6 −4 −2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians
x
Tae
thed
, f(x
)
DTU Compute Introduktion til Statistik Efterar 2020 28 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordeling, sandsynligheder
Fordeling af vægt af rugbrød:
Antag at vægten af et rugbrød fra en produktionslinie kan beskrives med ennormalfordeling
X ∼ N(500,102)
dvs. middelværdi µ = 500 gram og standardafvigelse σ = 10 gram.Vi vil male vægten af et tilfældigt udvalgt brød.
Spørgsmal:
1: Hvad er sandsynligheden for at brødet vejer under 490 g?2: Hvad er sandsynligheden for at brødet vejer mere en 20 g forskelligt fra 500 g?
DTU Compute Introduktion til Statistik Efterar 2020 29 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordeling, spørgsmal 1
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
1: Hvad er sandsynligheden for at brødet vejer under 490 g?
Svar: P(X ≤ 490) = F(490) = 0.16
pnorm(490, mean=500, sd=10)
DTU Compute Introduktion til Statistik Efterar 2020 30 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordeling, spørgsmal 2
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
1: Hvad er sandsynligheden for at brødet vejer mere end 20 g forskelligt fra 500 g?
Svar: P(X ≤ 480∨X > 520) = 2 ·P(X ≤ 480) = 2 ·F(480) = 0.046
2 * pnorm(480, mean=500, sd=10)
DTU Compute Introduktion til Statistik Efterar 2020 31 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Spørgsmal: Sandsynlighed i normalfordeling
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
Hvad er sandsynligheden for at rugbrødet vejer over 510 g?
A: F(510) B: 1−F(490) C: 1−F(520) D: 1−F(510)
Svar: P(X > 510) = 1−P(X ≤ 510) = 0.16
DTU Compute Introduktion til Statistik Efterar 2020 32 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Normalfordeling fraktiler
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
95%
? ?
“Omvendt spørgsmal”: Hvilket interval, symmetrisk om midten, dækker 95% afrugbrødene?
qnorm(c(0.025,0.975), mean=500, sd=10)
[1] 480.4 519.6DTU Compute Introduktion til Statistik Efterar 2020 33 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Standard normalfordelingen
En standard normalfordeling
Z ∼ N(0,12)
En normalfordeling med middelværdi 0 og varians 1.
Standardisering
En vilkarlig normalfordelt variabel X ∼ N(µ,σ2) kan standardiseres ved at beregne
Z =X−µ
σ
DTU Compute Introduktion til Statistik Efterar 2020 34 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Standard Normalfordeling
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
z er standardiseret vægt af et rugbrød (x-akse er i std. afvigelse)
f(z)
Z = X−µσ
Z ∼ N(0,12)
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x er vægt af et rugbrød
f(x)
X ∼ N(500,102)
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
z er standardiseret vægt af et rugbrød (x-akse er i std. afvigelse)
f(z)
Z = X−µσ
Z ∼ N(0,12)
1: Hvad er sandsynligheden for at brødet vejer under 490 gram?
Svar: P(X ≤ 490) = P(Z ≤ 490−50010 ) = P(Z ≤−1) = 0.16
pnorm(-1)
DTU Compute Introduktion til Statistik Efterar 2020 35 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Transformation til standard normalfordeling
0 100 200 300 400 500 600
0.0
0.1
0.2
0.3
0.4
X ∼ N(500,102)
Z = X−µσ = X−500
10 ∼ N(0,12)
DTU Compute Introduktion til Statistik Efterar 2020 36 / 54
Konkrete Statistiske fordelinger Normalfordelingen
Eksempel: Transformation til standard normalfordeling
-10 -5 0 5 10
0.00
0.05
0.10
0.15
0.20
x
f(x)
A
460 480 500 520 540
0.00
0.01
0.02
0.03
0.04
x
f(x)
B
-200 -160 -1200.00
0.02
0.04
0.06
0.08
x
f(x)
C
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
f(x)
D
1: Hvilken af disse er standard normalfordelingens pdf?
Svar: D, for ca. µ±3σ er f (x)≈ 0 for Z ∼ N(0,12).
DTU Compute Introduktion til Statistik Efterar 2020 37 / 54
Konkrete Statistiske fordelinger Log-Normalfordelingen
Log-Normalfordelingen
Skrivemade:
X ∼ LN(α,β 2) (Hvis X følger log-normal sa følger ln(X) normal)
Tæthedsfunktion:
f (x) =
{1
x√
2πβe−(ln(x)−α)2/2β 2
x > 0, β > 00 ellers
Middelværdi:
µ = eα+β 2/2
Varians:
σ2 = e2α+β 2(eβ 2 −1)
DTU Compute Introduktion til Statistik Efterar 2020 38 / 54
Konkrete Statistiske fordelinger Log-Normalfordelingen
Eksempel: Log-normalfordelingen
0 5 10 15 20 25 300
0.05
0.1
0.15
0.2
0.25
LN(1,1)
x
Tae
thed
, f(x
)Log−Normalfordeling LN(1,1)
DTU Compute Introduktion til Statistik Efterar 2020 39 / 54
Konkrete Statistiske fordelinger Log-Normalfordelingen
Log-normalfordelingen
Lognormal og Normalfordelingen:
En log-normalfordelt variabel Y ∼ LN(α,β 2), kan transformeres til en standardnormalfordelt variabel Z ved
Z =ln(Y)−α
βdvs.
Z ∼ N(0,12)
DTU Compute Introduktion til Statistik Efterar 2020 40 / 54
Eksponentialfordelingen
Eksponentialfordelingen
Skrivemade:
X ∼ Exp(λ )
Tæthedsfunktionen
f (x) ={
λe−λx x > 00 ellers
Middelværdi
µ = 1λ
Varians
σ2 = 1λ 2
DTU Compute Introduktion til Statistik Efterar 2020 42 / 54
Eksponentialfordelingen
Eksempel: Eksponentialfordelingen
−1 0 1 2 3 4 5 6 7 8 9 100
0.2
0.4
0.6
0.8
1
EXP(1)
x
Tae
thed
, f(x
)Eksponential fordeling med β=1
DTU Compute Introduktion til Statistik Efterar 2020 43 / 54
Eksponentialfordelingen
Eksponentialfordelingen
Eksponentialfordelingen er et special tilfælde af Gammafordelingen
Eksponentialfordelingen anvendes f.eks. til at beskrive levetider og ventetider
Eksponentialfordelingen kan bruges til at beskrive (vente)tiden mellemhændelser i poissonproces
DTU Compute Introduktion til Statistik Efterar 2020 44 / 54
Eksponentialfordelingen
Sammenhæng mellem eksponential- og poissonfordelingen
tid t∗ ∗ ∗ ∗ ∗ ∗ ∗
t1 t2
Poisson: Diskrete hændelser pr. enhed
Eksponential: Kontinuert afstand mellem hændelser
DTU Compute Introduktion til Statistik Efterar 2020 45 / 54
Eksponentialfordelingen
Eksempel: Eksponentielfordeling
Kø-model - poissonproces
Tiden mellem kundeankomster pa et posthus er eksponentialfordelt medmiddelværdi µ = 2 minutter, dvs. λ = 1
µ = 12
1min (skaleret λ2min = 1 1
2min ).
Spørgsmal:
En kunde er netop ankommet. Beregn sandsynligheden for at der ikke kommerflere kunder indefor en periode pa 2 minutter vha. poissonfordelingen
Svar:
Med Poissonfordelingen (periodelængden skal svare til spørgsmalet, brug λ2min):
dpois(x=0, lambda=1)
Brug Eksponentialfordeling (Xexp ∼ Exp(λ ) med λ = 12
1min , find P(Xexp > 2)):
1-pexp(q=2, rate=1/2)
Giver 0.37
DTU Compute Introduktion til Statistik Efterar 2020 46 / 54
Regneregler for middelværdi og varians
Regneregler for lineær funktion af et X
Hvis:
X er en stokastisk variabel
Vi antager at a og b er konstanter
Da gælder (gælder BADE kontinuert og diskret):
Middelværdi-regel:
E(aX+b) = aE(X)+b
Varians-regel:
V(aX+b) = a2 V(X)
DTU Compute Introduktion til Statistik Efterar 2020 48 / 54
Regneregler for middelværdi og varians
Eksempel: Regneregler for lineær funktion af et X
X er en stokastisk variabel
En stokastisk variabel X har middelværdi 4 og varians 6.
Spørgsmal:
Beregn middelværdi og varians for Y =−3X+2
Svar:
E(Y) = E(−3X+2) =−3E(X)+2 =−3 ·4+2 =−10
V(Y) = V(−3X+2) = (−3)2 V(X) = 9 ·6 = 54
DTU Compute Introduktion til Statistik Efterar 2020 49 / 54
Regneregler for middelværdi og varians
Regneregler for lineær funktion af flere Xer
Hvis:
X1, . . . ,Xn er stokastiske variable
Da gælder (nar de er uafhængige) (gælder BADE kontinuert og diskret):
Middelværdi-regel:
E(a1X1 +a2X2 + . . .+anXn) = a1 E(X1)+a2E(X2)+ . . .+anE(Xn)
Varians-regel:
V(a1X1 +a2X2 + . . .+anXn) = a21 V(X1)+a2
2 V(X2)+ . . .+a2n V(Xn)
DTU Compute Introduktion til Statistik Efterar 2020 50 / 54
Regneregler for middelværdi og varians
Eksempel: Regneregler for lineær funktion af flere Xer
Flypassager-planlægning
Vægten af een passagerer pa fly pa en strækning antages normalfordeltX ∼ N(70,102).
Et fly, der kan tage 55 passagerer, ma max. lastes med 4000 kg (kun passageresvægt betragtes som last).
Spørgsmal:
Beregn sandsynligheden for at flyet bliver overlastet.
Hvad er den samlede passagervægt Y pa en afgang?
A: Y = 55 ·X B: Y = ∑55i=1 Xi C: Y = 55+X D: Ej A,B eller C
Svar B: Y = ∑55i=1 Xi, det er summen af 55 forskellige passagerer.
DTU Compute Introduktion til Statistik Efterar 2020 51 / 54
Regneregler for middelværdi og varians
Eksempel: Regneregler 3
Hvad er den samlede passagervægt Y pa en afgang?
Y = ∑55i=1 Xi, hvor Xi ∼ N(70,102)
Middelværdi og varians for Y:
E(Y) =55
∑i=1
E(Xi) =55
∑i=1
70 = 55 ·70 = 3850
V(Y) =55
∑i=1
V(Xi) =55
∑i=1
100 = 55 ·100 = 5500
Bruger normalfordeling for Y:
1-pnorm(4000, mean = 3850, sd = sqrt(5500))
[1] 0.022
DTU Compute Introduktion til Statistik Efterar 2020 52 / 54
Regneregler for middelværdi og varians
Eksempel: Regneregler 3 - FORKERT ANALYSE
Hvad er Y?
I hvert fald IKKE: Y = 55 ·X !!!!!!
Middelværdi og varians for Y:
E(Y) = 55 ·70 = 3850
V(Y) = 552 V(X) = 552 ·100 = 5502 = 302500
Bruger normalfordeling for Y:
1-pnorm(4000, mean = 3850, sd = 550)
[1] 0.39
Konsekvens af forkert beregning:
MANGE spildte penge for flyselskabet!!!
DTU Compute Introduktion til Statistik Efterar 2020 53 / 54
Regneregler for middelværdi og varians
Lineær kombination af normalfordelte stokastiske variablerer ogsa normalfordelt
Lineær kombination af normalfordelte stokastiske variabler er ogsanormalfordelt
Theorem 2.40: Let X1, . . . ,Xn be independent normal random variables, thenany linear combination of X1, . . . ,Xn will follow a normal distribution, withmean and variance given in Theorem 2.56.
DTU Compute Introduktion til Statistik Efterar 2020 54 / 54