116
Institut for Farmaci Danmarks Farmaceutiske Universitet Henrik Spliid, Februar 2005 Kompendium til Elementær Statistik Kursus F22-1 Henrik Spliid Indhold : 1. Valg af fordeling for stokastiske variable 2. Mere om Poissonfordelingen 3. Datablade for Poisson-, binomial- og normalfordelingen 4. Kommenterede løsninger til opgaver fra lærebogen 5. F-Fordelingen (udvidet) 6. Rettede kurveblade 7. Engelsk - dansk ordliste 8. Symbolliste 1

Kompendium til Elementˆr Statistik Kursus F22-1 · Kompendium til Elementˆr Statistik Kursus F22-1 Henrik Spliid ... X =Antalγ-partikler i et vist tidsrum fra en radioaktiv kilde

Embed Size (px)

Citation preview

Institut for FarmaciDanmarks Farmaceutiske Universitet

Henrik Spliid, Februar 2005

Kompendium til Elementær Statistik

Kursus F22-1

Henrik Spliid

Indhold :

1. Valg af fordeling for stokastiske variable

2. Mere om Poissonfordelingen

3. Datablade for Poisson-, binomial- og normalfordelingen

4. Kommenterede løsninger til opgaver fra lærebogen

5. F-Fordelingen (udvidet)

6. Rettede kurveblade

7. Engelsk - dansk ordliste

8. Symbolliste

1

Indhold

1 Valg af fordeling for stokastiske variable 6

1.1 Diskrete fordelinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2 De mest benyttede diskrete fordelinger . . . . . . . . . . . . . . . . . . 6

1.2.1 Poissonfordelingen: Pois(λ) . . . . . . . . . . . . . . . . . . . . 6

1.2.2 Binomialfordelingen: Bin(n,p) . . . . . . . . . . . . . . . . . . . 7

1.2.3 Bernoulli-fordelingen: Bern(p) . . . . . . . . . . . . . . . . . . . 9

1.3 Andre diskrete fordelinger . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3.1 Hypergeometrisk fordeling: Hyp(n,M,N) . . . . . . . . . . . . . 9

1.3.2 Multinomialfordelingen: Multi(n, p1, p2, . . . , pk) . . . . . . . . . . 9

1.3.3 Geometrisk fordeling: Geom(p) . . . . . . . . . . . . . . . . . . 10

1.4 Kontinuerte fordelinger . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4.1 Exponentialfordelingen: Exp(β) . . . . . . . . . . . . . . . . . . 11

1.4.2 Gammafordelingen: Gam(k,β) . . . . . . . . . . . . . . . . . . . 11

1.4.3 Uniformfordelingen: U(α,β) . . . . . . . . . . . . . . . . . . . . 12

1.4.4 Normalfordelingen: N(µ,σ2) . . . . . . . . . . . . . . . . . . . . 13

1.4.5 Log-normalfordelingen: LN(α, β2) . . . . . . . . . . . . . . . . . 15

2 Mere om Poissonfordelingen 18

2.1 Sandsynlighedsfordeling . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2 Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3 Nogle enkle egenskaber . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.4 Relation til eksponentialfordelingen . . . . . . . . . . . . . . . . . . . . 19

2.5 Relation til χ2-fordelingen og normalfordelingen . . . . . . . . . . . . . 19

2.6 Inferens i Poissonfordelingen for en stikprøve . . . . . . . . . . . . . . . 19

2.6.1 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.6.2 Konfidensintervaller . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.6.3 Hypoteseprøvning . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2

2.6.4 OC-funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.7 Inferens for to eller flere stikprøver . . . . . . . . . . . . . . . . . . . . 21

2.7.1 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.7.2 Konfidensinterval . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.7.3 Sammenligning af to Poissonfordelinger . . . . . . . . . . . . . . 22

2.7.4 Sammenligning af flere Poissonfordelinger . . . . . . . . . . . . . 23

2.8 Eksempel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Datablade for Poisson-, binomial- og normalfordelingen 24

3.1 Datablad for Poissonfordelingen . . . . . . . . . . . . . . . . . . . . . . 24

3.2 Datablad for binomialfordelingen . . . . . . . . . . . . . . . . . . . . . 25

3.3 Datablad for normalfordelingen . . . . . . . . . . . . . . . . . . . . . . 26

4 Kommenterede løsninger til opgaver. Numre og sidetal fra 7. udgave(med 6. udg. i parentes) 28

4.1 Opgave 4.21, side 114 (4.19, side 111) . . . . . . . . . . . . . . . . . . . 28

4.2 Opgave 5.91, side 190 (187) . . . . . . . . . . . . . . . . . . . . . . . . 28

4.3 Opgave 5.113, side 201 (197) . . . . . . . . . . . . . . . . . . . . . . . . 29

4.4 Opgave 5.116, side 201 (197) . . . . . . . . . . . . . . . . . . . . . . . . 30

4.5 Opgave 5.119, side 201 (197) . . . . . . . . . . . . . . . . . . . . . . . . 31

4.6 Opgave 6.2, side 214 (210) . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.7 Opgave 6.3, side 214 (210) . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.8 Opgave 6.5, side 215 (210) . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.9 Opgave 6.17, side 216 (212) . . . . . . . . . . . . . . . . . . . . . . . . 33

4.10 Opgave 6.20, side 221 (217) . . . . . . . . . . . . . . . . . . . . . . . . 34

4.11 Opgave 6.21, side 221 (217) . . . . . . . . . . . . . . . . . . . . . . . . 35

4.12 Opgave 6.23, side 221 (218) . . . . . . . . . . . . . . . . . . . . . . . . 36

4.13 opgave 7.4 og 7.5, side 235 (231) . . . . . . . . . . . . . . . . . . . . . . 38

4.14 Opgave 7.11, side 236 (231) . . . . . . . . . . . . . . . . . . . . . . . . 38

4.15 Opgave 7.15, side 236 (232) . . . . . . . . . . . . . . . . . . . . . . . . 39

3

4.16 Opgave 7.24, side 237 (232) . . . . . . . . . . . . . . . . . . . . . . . . 40

4.17 Opgave 7.28, side 244 (240) . . . . . . . . . . . . . . . . . . . . . . . . 41

4.18 Opgave 7.38, side 245 (241) . . . . . . . . . . . . . . . . . . . . . . . . 42

4.19 Opgave 7.43, side 257 (253) . . . . . . . . . . . . . . . . . . . . . . . . 43

4.20 Opgave 7.48, side 257 (253) . . . . . . . . . . . . . . . . . . . . . . . . 44

4.21 Opgave 7.49, side 257 (253) . . . . . . . . . . . . . . . . . . . . . . . . 44

4.22 Opgave 7.63, side 269 (265) . . . . . . . . . . . . . . . . . . . . . . . . 45

4.23 Opgave 7.68, side 270 (266) . . . . . . . . . . . . . . . . . . . . . . . . 45

4.24 Opgave 7.69, side 270 (266) . . . . . . . . . . . . . . . . . . . . . . . . 48

4.25 Opgave 7.70, side 270 (266) . . . . . . . . . . . . . . . . . . . . . . . . 49

4.26 Opgave 7.72, side 272 (267) . . . . . . . . . . . . . . . . . . . . . . . . 51

4.27 Opgave 8.5, side 284 (277) . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.28 Opgave 8.9, side 289 (281) . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.29 Opgave 8.15, side 289 (282) . . . . . . . . . . . . . . . . . . . . . . . . 54

4.30 Opgave 9.1, side 297 (289) . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.31 Opgave 9.2, side 297 (289) . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.32 Opgave 9.10, side 298 (290) . . . . . . . . . . . . . . . . . . . . . . . . 57

4.33 Opgave 9.11, side 298 (290) . . . . . . . . . . . . . . . . . . . . . . . . 58

4.34 Opgave 9.19, side 306 (298) . . . . . . . . . . . . . . . . . . . . . . . . 58

4.35 Opgave 9.28, side 307 (299) . . . . . . . . . . . . . . . . . . . . . . . . 59

4.36 Opgave 9.29, side 307 (299) . . . . . . . . . . . . . . . . . . . . . . . . 61

4.37 Opgave 9.39, side 313 (305) . . . . . . . . . . . . . . . . . . . . . . . . 62

4.38 Opgave 9.41, side 314 (306) . . . . . . . . . . . . . . . . . . . . . . . . 63

4.39 Opgave 9.47, side 315 (307) . . . . . . . . . . . . . . . . . . . . . . . . 65

4.40 Opgave 11.4 side 352 (11.2, side 345) . . . . . . . . . . . . . . . . . . 68

4.41 Opgave 11.5, side 353 (11.3, side 345) . . . . . . . . . . . . . . . . . . 70

4.42 Opgave 11.6, 11.7 11.8 side 353 (11.4, 11.5 og 11.6, side 345) . . . . . . 70

4.43 Opgave 12.6, side 414 (403) . . . . . . . . . . . . . . . . . . . . . . . . 74

4

4.43.1 Model kontrol: . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.44 Opgave 12.10, side 415 (404) . . . . . . . . . . . . . . . . . . . . . . . . 77

4.45 Opgave 12.50 side 446 (12.48, side 434) . . . . . . . . . . . . . . . . . . 79

4.46 Opgave 12.54 side 447 (12.52, side 435) . . . . . . . . . . . . . . . . . . 82

4.47 Opgave 13.1, side 466 (455) . . . . . . . . . . . . . . . . . . . . . . . . 85

5 Udvidet tabel for F -fordelingen 89

6 Rettede kurveblade til ”Miller & Freund” p 585 103

7 Engelsk-dansk ordliste jfr. bogens indeksregister 105

8 Symbolliste til ”Miller & Freund” 7. (og 6.) udgave 115

5

1 Valg af fordeling for stokastiske variable

1.1 Diskrete fordelinger

Karakteristikum: Den stokastiske variabel, X har kun diskrete udfald.

De mulige udfald ordnes (oftest) som heltallige udfald, dvs, at X typisk kan antageværdier som heltallene 0, 1, 2, . . ..

Det mest almindelige diskrete udfald er, hvor man tæller et vist antal af bestemtehændelser eller udfald.

1.2 De mest benyttede diskrete fordelinger

1.2.1 Poissonfordelingen: Pois(λ)

BiologiX = Optalt antal insekter af en bestemt art pa en bestemt plante. X kan antageværdierne 0, 1, 2, . . ..

BiologiX = Optalt antal dyr af en bestemt art pa et bestemt areal (f.eks. grønne løvfrøerpa en kvadratkm. mose).

BiokemiX = Optalt antal svampe-vækstpunkter i et felt pa en petriskal med en vandprøve.

TrafikX = Optalt antal cyklister, som passerer et bestemt sted i et bestemt tidsrum.

TelefoniX = Optalt antal SMS-beskeder, som en bestemt mobilsendemast skal handterei et bestemt tidsrum, f.eks. i et minut.

Sundhed/sygdomX = Antal af en bestemt mikroorganisme (f.eks. en bestemt virus) i en ml. blodfra en (potentielt) smittet patient.

FysikX = Antal γ-partikler i et vist tidsrum fra en radioaktiv kilde (en bestemtmængde, f.eks. 1 mg).

Approximation/grænseHvis X ∈ Binomial(n, p) = Bin(n, p) for n meget stor og p meget lille: Bin(n, p) ⇒Pois(np), se nedenfor og bogen side 126.

I alle eksemplerne er X heltallig og i princippet ubegrænset, omend sandsynlighedenfor meget store X-værdier kan være hastigt aftagende.

6

X ∈ Pois(λ) ⇐⇒ PrX = x =λx · e−λ

x!; x = 0, 1, 2, . . .

PrX ≤ x =x∑

i=0

λi · e−λ

i!; x = 0, 1, 2, . . .

EX = λ og V X = λ

Approximation for store λ-værdier: Pois(λ) ⇒ N(λ, λ) ⇒

PrX ≤ x ' PrN(λ, λ) ≤ x +1

2 = Φ

(x + 1/2 − λ√

λ

)

Prx1 ≤ X ≤ x2 ' Φ

(x2 + 1/2 − λ√

λ

)− Φ

(x1 − 1/2 − λ√

λ

)

Hvis X1 ∈ Pois(λ1) og X2 ∈ Pois(λ2) ⇒ X1 + X2 ∈ Pois(λ1 + λ2). Kan generaliserestil flere Poissonfordelte variable. Parameteren λ kaldes ofte Poissonintensiteten.

1.2.2 Binomialfordelingen: Bin(n,p)

BiologiUndersøg n individer af en bestemt art insekter (bananfluer f.eks.) og optæl X= antal (blandt de n) af en bestemt fænotype (med et bestemt fremtoningspræg,øjenfarve f.eks.). X kan antage værdierne 0, 1, 2, . . . , n dvs. heltallig, men be-grænset til max. n.

Sundhed/SygdomUndersøg n personer og optæl X = antal personer (blandt de n), som har etbestemt antistof (for en vis sygdom f.eks.) i blodet. X kan igen antage værdierne0, 1, 2, . . . , n dvs. heltallig, men begrænset til max. n, det samlede antal un-dersøgte individer.

BiokemiForetag udstrygning af en vandprøver fra et vandværk pa n petriskale. OptælX = antallet af petriskale (blandt de n), som udviser vækst. p angiver sandsyn-ligheden for vækst pa en skal.

TrafikStop n cyklister, som passerer et bestemt sted pa en cykelsti, og registrer X= antal heraf, som kører uden cykellygte. p angiver sandsynligheden for, at encyklist kører uden lygte. X kan igen antage værdierne 0, 1, 2, . . . , n dvs. heltallig,men begrænset til max. n, det samlede antal standsede cyklister.

Lægemidler/KvalitetskontrolUdtag n ampuller med et vist lægemiddel, og undersøg de enkelte ampullersindhold mht. koncentration/styrke af aktivt stof. X = antal ampuller af util-fredsstillende kvalitet (blandt de n undersøgte ampuller). p angiver fejlandelenaf ampuller.

7

Fysik/MaterialerUdtag n prøver af et bestemt materiale. Mal pa de n prøver, om de kan modstaen vis elektrisk spændingsbelastning. X = antal blandt de n prøver, som modstarbelastningen. p angiver andelen af materialeprøver, som modstar belastningen.

I eksemplerne er X i alle tilfælde heltallig, men begrænset til max. n.

X ∈ Bin(n, p) ⇐⇒ PrX = x =

(nx

)px(1 − p)n−x ; x = 0, 1, 2, . . . , n

PrX ≤ x =x∑

i=0

(ni

)pi(1 − p)n−i ; x = 0, 1, 2, . . . , n

EX = np og V X = np(1 − p)

Approximation for store n-værdier men sma p-værdier:Bin(n, p) ⇒ Pois(np) ⇒

PrX ≤ x ' PrPois(np) ≤ x

Anvendes fortrinsvis for n ≥ 20 og p ≤ 0.05. Andre brugbare regler er (n ≥ 50 ognp ≤ 5) eller (n ≥ 100 og np ≤ 10) eller tilsvarende.

Approximation for store n-værdier og np ≥ 5 og n(1 − p) ≥ 5:Bin(n, p) → N(np, np(1 − p)) ⇒

PrX ≤ x ' Φ

x + 1/2 − np√np(1 − p)

Prx1 ≤ X ≤ x2 ' Φ

x2 + 1/2 − np√np(1 − p)

− Φ

x1 − 1/2 − np√np(1 − p)

Hvis X1 ∈ Bin(n1, p) og X2 ∈ Bin(n2, p) ⇒ X1 + X2 ∈ Bin(n1 + n2, p). Kan genera-liseres til flere binomialfordelte variable.

8

1.2.3 Bernoulli-fordelingen: Bern(p)

Binomialfordelingen for n = 1:

X ∈ Bern(p) ⇔ f(x) = PrX ≤ x = px(1 − p)1−x for x = 0, 1

EX = p og V X = p(1 − p)

Hvis X1 ∈ Bern(p) og X2 ∈ Bern(p) ⇒ X1 + X2 ∈ Bin(2, p). Kan generaliseres tilflere Bernoullifordelte variable.

1.3 Andre diskrete fordelinger

1.3.1 Hypergeometrisk fordeling: Hyp(n,M,N)

Udtagning af prøver uden tilbagelægning/KvalitetskontrolSæt, at man har i alt N enheder og, at ud af disse er præcis M defekte. Udtager vinu en stikprøve pa n enheder blandt de N , vil antallet af defekte, X, i stikprøvenfølge en hypergeometrisk fordeling. X kan antage værdierne 0, 1, 2,...,M.

X ∈ Hyp(n, M, N) ⇐⇒ PrX = x =

(Mx

)(N − Mn − x

)(

Nn

)

EX = n · M/N og V X = nM

N

(N − M)

N

(N − n)

(N − 1)

Approximation for n << N og n << (N − M): Hyp(n, M, N) ⇒ Bin(n, M/N)

1.3.2 Multinomialfordelingen: Multi(n, p1, p2, . . . , pk)

Kaldes i mange fremstillinger ogsa for polynomial-fordelingen. Er en generalisering afbinomialfordelingen.

BiologiUndersøg n individer af en bestemt art (mennesker f.eks.) og opdel dem efterfænotype (med et bestemt fremtoningspræg, øjenfarve f.eks.). X1 er antal medbla øjne, X2 er antal med brune øjne, X3 er antal med grønne øjne, X4 er antalmed gra øjne, X5 er antal med andre øjenfarver (f.eks. et brunt og et blat øje).p1, p2, . . . , pk angiver andelene af de k kategorier.

Sundhed/SygdomUndersøg n personer af en bestemt kategori (f.eks. mænd med en bestemtsygdomsdisposition) og optæl X = antal personer (blandt de n), som har en

9

bestemt blodtype. X1=antal blodtype 0, X2=antal blodtype A, X3=antal blod-type B, X4=antal blodtype AB. (p1, p2, p3, p4) angiver blodtypefordelingen forden pagældende kategori af personer.

KvalitetskontrolUdtag n prøver af en vare (f.eks. en stor sending af et medicinsk præparat) ogkategoriser de enkelte prøver efter X1= antal OK, X2= antal med sma fejl, X3=antal med betydelige fejl, X4= antal med kritiske fejl.

f(x1, x2, . . . , xk) = PrX1 = x1 ∩ X2 = x2 ∩ . . . ∩ Xk = xk =n! · px1

1 px22 · · · pxk

k

x1!x2! · · ·xk!

EX1, X2, . . . , Xk = (np1, np2, . . . , npk)

Det gælder, at X1 + X2 + . . . + Xk = n og p1 + p2 + . . . + pk = 1.

1.3.3 Geometrisk fordeling: Geom(p)

Den geometriske fordeling hører sammen med binomialfordelingen, idet den er fordelingfor ventetiden (malt i antal) ved gentagne binomialforsøg, indtil man møder den første“succes”. X kan antage heltalsværdierne 1, 2, 3,..., i princippet ubegrænset.

KvalitetskontrolUdtag prøver af en vare (f.eks. en sending af et medicinsk præparat) og bliv ved,indtil du finder den første fejlbehæftede enhed. X angiver antal prøver, der erudtaget ialt (altsa inklusiv den fejlbehæftede). X kan antage værdierne 1, 2, 3,... (principielt ubegrænset).

BiologiSæt, at man vil udvikle en ny type plante, hvor man forsøger at krydse to beslæg-tede arter. I et forsøg krydses de to arter, og X angiver antal forsøg, der skalgøres, indtil (og med) det første gang lykkes at fa en levedygtig plante, der kanopformeres. X kan antage værdierne 1, 2, 3, ... (principielt ubegrænset).

SundhedSæt, at man har en behandlingsmetode, som ikke virker hver gang, men kun meden vis sandsynlighed, f.eks. et bestemt træningprogram (rygeafvænning f.eks).Hvis sandsynligheden for, at et behandlingsforsøg virker, er p, vil antallet afnødvendige behandlinger følge en geomentrisk fordeling med parameter p. X kanantage værdierne 1, 2, 3, ... (principielt ubegrænset).

X ∈ Geom(p) ⇔ f(x) = PrX = x = p(1 − p)x for x = 1, 2, 3, . . .

PrX ≤ x =x∑

i=1

p(1 − p)i for

EX = 1/p og V X = (1 − p)/p2

10

1.4 Kontinuerte fordelinger

Karakteristikum: Den stokastiske variabel, X er kendetegnet ved, at den kan antageikke heltallige værdier, f.eks. alle reelle tal (normalfordelingen), de positive tal (log-normalfordelingen) eller eksponentialfordelingen. De kan ogsa være begrænset til etinterval som i den uniforme fordeling.

1.4.1 Exponentialfordelingen: Exp(β)

Hører naturligt sammen med Poissonfordelingen, idet den er ventetidsfordeling for dennæste hændelse i en Poissonproces. X kan antage positive reelle værdier , dvs. allex > 0.

Biologi/TrafikMan maler tiden, der gar, mellem en bestemt dyreart observeres pa et bestemtsted eller tidsafstanden mellem cyklister uden lys pa en bestemt vej. Tiden,T , mellem observationerne kan ofte beskrives ved en exponentialfordeling. Hvisantallet X pr tidsenhed er Poissonfordelt med parameter λ, er tidsafstanden Texponentialfordelt med middelværdi β = 1/λ - og vice versa.

FysikVentetiden, T , mellem to γ-partikler fra en radioaktiv kilde.

Kvalitetskontrol/Levetidsundersøgelser For mange komponenter i appa-rater kan tiden fra komponenten ibrugtages, til den fejler (f.eks. en el-pære,som brænder over) beskrives ved en exponentialfordeling. Den gennemsnitligetid kaldes ofte komponentens middellevetid eller blot levetiden.

X ∈ exp(β) ⇔ f(x) =1

βexp(−x/β) for x > 0 og β > 0

F (x) = PrX ≤ x =∫ x

0f(t)dt = 1 − exp(−x/β)

EX = β og V X = β2

Hvis X1 ∈ exp(β) og X2 ∈ exp(β) ⇒ X1 + X2 ∈ Gam(2, β). Kan generaliseres til flereexponentialfordelte variable.

1.4.2 Gammafordelingen: Gam(k,β)

hører naturligt sammen med Poisson- og exponentialfordelingen. Den er nemlig ven-tetidsfordeling mellem k hændelser, hvor de enkelte hændelsers tidsafstande alle erexponentialfordelte exp(β) og ikke influerer pa hinanden (er uafhængige, som mansiger). X kan antage positive reelle værdier , dvs. alle x > 0.

11

Biologi/TrafikMan maler tiden, der gar, mellem en bestemt dyreart observeres pa et bestemtsted eller tidsafstanden mellem cyklister uden lys pa en bestemt vej. Tiden, T , framan starter med at observere, til det k’te individ observeres, følger en Gam(k, β)-fordeling, hvis tidsafstandende fra et individ til det næste er exponentialfordeltexp(β).

Køteori/PlanlægningMan kan forestiller sig, at det tager en bestemt tid at udføre en bestemt opgave(f.eks. en operation pa et sygehus). Samtidig ankommer kunder (patienter), somskal behandles med en vis intensitet, som kunne svare til en Poissonfordeling.Man kan sa være interesseret i at vurdere sandsynligheden for, at køen af kunder(patienter) ikke overskrider et vist antal, svarende til, at der ikke ankommer flereend et vist antal i et bestemt tidsrum.

Hvis T er ventetiden til den k’te kunde (patient) ankommer, er PrT ≤ t0 ligmed sandsynligheden for, at den k’te kunde (patient) ankommer inden tidspunk-tet t0

X ∈ Gam(k, β) ⇔ f(x) =xk−1

βkΓ(k)exp(−x/β) for x > 0 , k > 0 og β > 0

F (x) = PrX ≤ x =∫ x

0f(t)dt (beregnes pa computer f.eks.)

EX = k · β og V X = k · β2

Hvis X1 ∈ Gam(k1, β) og X2 ∈ Gam(k2, β) ⇒ X1 + X2 ∈ Gam(k1 + k2, β). Kangeneraliseres til flere gammafordelte variable.

1.4.3 Uniformfordelingen: U(α,β)

Afrundingsfejl/MalingNar man anfører et maleresultat afrundet til et begrænset antal cifre, vil dervære en afvigelse fra den faktiske værdi. Pa et pH-meter udlæses f.eks. værdienpH=7.42. Den faktiske pH-værdi ligger et sted i intervallet [7.415 − 7.425] ogmed lige stor sandsynlighed over hele intervallet.

Afrundingsfejlen X er altsa mellem -0.005 og +0.005, dvs X ∈ U(−0.005, +0.005).

Fysik/MaterialerHvis man undersøger et stykke metaltrad af en bestemt længde, f.eks. b, og finderdens svageste sted, vil man i reglen antage, at dette optræder et helt tilfældigtsted over tradens længde. Kaldes stedet X, vil X ∈ U(0, b).

BiologiUnder et eksperiment har man pa et bestemt tidspunkt t0 et individ, som lever.Til tiden t1 konstaterer man, at individet er dødt. Hvis man ikke ved andet, vilman kunne benytte uniformfordelingen U(t0, t1) som model for tidspunktet, hvorindividet døde.

12

X ∈ U(α, β) ⇔ f(x) =1

β − αfor α < x < β

PrX ≤ x =∫ x

αf(t)dt =

x − α

β − α

EX = (α + β)/2 og V X = (β − α)2/12

1.4.4 Normalfordelingen: N(µ,σ2)

er statistikkens (uden sammenligning) mest betydningsfulde fordeling, og den benyttesi et utal af sammenhænge, dels som model for et stort antal naturligt forekommende(mere eller mindre) tilfældige fænomener. Desuden er den grænsefordeling for mangeandre fordelinger. X kan antage alle reelle værdier.

Den centrale grænseværdisætningDenne sætning findes i flere varianter. Den enkleste er: Antag , at Xi , i =1, 2, . . . , n, er uafhængige stokastiske variable med samme fordeling, der harmiddelværdi µ og varians σ2. Da vil summen

n∑i=1

Xi asymptotisk ∈ N(nµ, nσ2)

Sætningen findes i andre varianter, hvor det f.eks.ikke kræves, at alle X’er harhelt samme fordeling.

Hovedbudskabet er, at summer af mange stokastiske variable, som er af nogen-lunde samme størrelsesorden, (eventuelt tilnærmelsesvist) vil følge en normal-fordeling.

ApproximationMange approksimationer udspringer af den centrale grænseværdisætning. Hvisf.eks. EXi = µ og V Xi = σ2 vil gennemsnit X = (

∑Xi)/n ikke alene have

en middelværdi µ og varians σ2/n, den vil ogsa (evt tilnærmelsesvist) følge ennormalfordeling.

Poisson- og binomialfordelingen tilnærmes for store n ved normalfordelingen(se under disse).

Fysik/Kemi/MalefejlEn fysisk eller kemisk størrelse har en bestemt (men ukendt) værdi f.eks. θ,som kunne være pH=6.4987856432765712456....=θ, dvs en reel værdi. Med enmalemetode forsøger man at bestemme θ, og man udlæser værdien Y . Malefejlener X = Y − θ.

Hvis man ikke kender noget til sit apparat, kan man ikke sige meget om, hvorden faktiske værdi θ ligger i forhold til maleresultatet Y . Dvs. man kan ikke sigepræcist hvor stor X i det konkrete tilfælde er, men en god model er (meget ofte),at X er normalfordelt med en vis middelværdi, µ, og en vis varians, σ2 (hvor µgerne skulle være nær nul og σ2 sa lille som muligt).

13

BiologiHvis man har en population, hvor der er en vis variation mellem individerne (detkan f.eks. være deres vægt, længde, eller andre fysisk-kemiske egenskaber), vilnormalfordelingen ofte være velegnet til at beskrive disse. Typisk vil der væreto fordelinger for en given aldersgruppe, nemlig en for hun-individer og en forhanindivider.

SundhedNar man bestemmer blodsukker hos en patient, vil dette variere omkring en visværdi, hvis man maler flere gange. Variationen omkring patientens middelniveau,µ, for indhold af sukker i blod beskrives godt med en normalfordeling med mid-delværdi µ (for raske personer mellem ca. 4 og 7 mmol/liter).

Kvalitetskontrol/LægemidlerVed fremstilling medicinske præparater tilstræbes, at deres styrke (koncentration)ligger i et bestemt (snævert) interval omkring den tilstræbte værdi µ. Der vilaltid være større eller mindre variationer for denne koncentration i forhold til dettilstræbte. Sadanne variationer bekrives i reglen godt med normalfordelingen.

MiljøpH-værdien i almindelig nedbør bør være gennemsnitligt nær 7, dvs neutral. Idet daglige vejr vil den faktiske nedbørs pH-værdi variere omkring en vis værdi,som kan være µ < 7 (sur regn). En egnet model for disse variationer er normal-fordelingen (hvis ikke pludselige begivenheder gør billedet atypisk - vulkanudbrudf.eks.).

FolkesundhedNar man maler en egenskab hos et stort antal personer (en normalbefolkningf.eks.) finder man hyppigt, at værdierne fordeler sig som fra en normalfordeling.Det gælder f.eks. længde og vægt af spædbørn med en vis alder, og pa sammemade vægt og længde for voksne (mænd og kvinder har typisk hver sin fordeling).Et mal for fedme er det sakaldte body mass index, som modelleres udmærket meden normalfordeling. Den enkelte persons værdi sammenholdes med normalpopu-lationens fordeling (den ma ikke ligge for langt væk fra midten).

IntelligensIntelligenskvotienten hos normale mennesker har et normalomrade, og en forde-ling, som intelligensforskere med et poppet udtryk kalder ’the bell curve’, deraltsa blot er normalfordelingen.

Sport/DopingNar sportsfolk indtager midlet epo (og lignende præparater) øges antal rødeblodlegener, dvs blodets evne til at optage ilt. Iltoptagelsesevnen males medden sakaldte hematocritværdi (koncentrationsmal for røde blodlegemer). Hosnormale unge personer, varierer denne omkring 45 for unge mænd og 41 for ungekvinder, i begge tilfælde med en spredning pa ca 3. Normalfordelingen kunnemuligvis anvendes, men i praksis ligger der relativt mange omkring fordelingensmidte, og fordelingens haler er hurtigere aftagende end i normalfordelingen. Ek-semplet er et eksempel pa, at selv i tilfælde, hvor normalfordelingen synes etoplagt valg, kan der være problemer.

14

DagligvarerNar man køber en dagligvare, f.eks. en pakke fødevarer med paskriften ’1000g’ vil det faktiske indhold afvige herfra. Ved pafyldning skal fabrikanten sikre,at sandsynligheden for, at der faktisk er mindre end de 1000 g, er lille. Det erikke tilstrækkeligt, at indholdet i middel for mange pakker er 1000 g (det er det,’e’-mærkningen handler om).

Som model for den faktisk pafyldte mængde benyttes gerne normalfordelingen,der følgelig skal have en middelværdi µ >1000 g, for at sikre, at kun fa pakker erundervægtige.

X ∈ N(µ, σ2) ⇔ f(x) =1

σ√

2πexp

(−(x − µ)2

2σ2

)

PrX ≤ x =∫ x

−∞f(t)dt = Φ

(x − µ

σ

)hvor

φ(x) =1√2π

exp

(−x2

2

)og Φ(x) =

∫ x

−∞φ(t)dt

EX = µ og V X = σ2

Hvis X1 ∈ N(µ1, σ21) og X2 ∈ N(µ2, σ

22) og Y = a + b · X1 + c · X2, vil for alle reelle a,

b og cY ∈ N(a + b · µ1 + c · µ2 , b2σ2

1 + c2σ22)

Resultatet kan generaliseres til alle linearkombinationer af vilkarligt mange uafhængigenormalfordelte variable.

1.4.5 Log-normalfordelingen: LN(α, β2)

Generelt, safremt Y ∈ N(α, β2) ⇔ X = eY ∈ LN(α, β2) (definition). Symbolet log(.)betegner den naturlige logaritme, dvs med grundtal e.

Det betyder altsa, at safremt X ∈ LN(α, β2), vil den naturlige logaritme af X følgeen N(α, β2)-fordeling. X kan antage positive reelle værdier, dvs. alle x > 0.

Nar man arbejder med log-normalfordelte værdier, logaritmetransformeres først, ogderefter benyttes normalfordelingen pa sædvanlig made.

PalidelighedSæt, at et system bestar af et stort antal komponenter, og at Q1, Q2, . . . , QN

angiver sandsynlighederne for, at de enkelte komponenter virker til et bestemttidspunkt. Q’erne er stokastiske variable, 0 << Qi ≤ 1, dvs at sandsynlighedenfor, at et eksemplar af systemet som helhed fungerer, er:

Qsystem = Q1 · Q2 · · ·QN

15

Tager vi nu den naturlige logaritme:

log(Qsystem) = log(Q1) + log(Q2) + · · · log(QN)

Ifølge den centrale grænseværdisætning vil log(Qsystem) (tilnærmelsesvist) følgeen normalfordeling. Qsystem selv vil følge en lognormalfordeling.

Biologi/Stokastisk vækstI mange biologiske systemer er væksten i et kort tidsrum (med en vis variation)proportional med den tilstedeværende mængde biomasse (bakterier, alger, gær-celler). Til tidspunktet i kaldes biomassen Xi og vækstkoefficienten er Ci.

Som model for væksten fra tiden i til tiden i + 1 benyttes da, at

Xi+1 = Xi + Ci · Xi = (1 + Ci)Xi

Kaldes biomassen til tiden ’0’ for x0, vil den til tiden n være

Xn = x0 · (1 + C1)(1 + C2) . . . (1 + Cn) = x0 · Πni=1(1 + Ci)

Hvis nu Ci’erne er stokastiske variable med (nogenlunde) samme fordeling, vil log-normalfordelingen ( igen ifølge den centrale grænseværdisætning) være en naturligfordeling for mængden af biomasse til et bestemt tidspunkt efter igangsætningenaf væksten.

Pulverteknologi/TabletterSom model for f.eks. kornstørrelsen af de enkelte korn i et pulver, som f.eks.presses til tabletter, benyttes log-normalfordelingen ofte.

Pa samme made benyttes log-normalfordelingen som model for savel vægtfordelin-gen som antalsfordelingen for forskellige fraktioner ved sigtning af pulvere.

Skæve fordelinger/TransformationI mange maletekniske situationer kan værdierne udvise en skæv fordeling, sam-tidig med, at det formelt set er umuligt at opna negative værdier (mal og vægtf.eks). Nar værdierne er langt fra 0, vil fordelingen ofte synes normal, men forsma værdier finder man hyppigt fordelinger, som ligner log-normalfordelinger.Følgende figur illustrerer dette:

0 1 2 3 4 5 6 7 80

0.2

0.4

0.6

0.8

1

1.2

1.4

α = 0.0 , β = 0.69

α = 0.5 , β = 0.50α = 1.0 , β = 0.34

α = −0.5 , β = 0.89

α = 2.0 , β = 0.22

5 log−normale fordelinger alle med varians 1

Man noterer, at fordelingen længst til højre meget ligner en normalfordeling,medens fordelingen for de sma værdier er meget (højre-)skæv.

16

X ∈ LN(α, β2) ⇔ f(x) =1

xβ√

2πexp

(−(log(x) − α)2

2β2

)

PrX ≤ x =∫ x

0f(t)dt = Φ

(log(x) − α

β

)hvor

φ(x) =1√2π

exp

(−x2

2

)og Φ(x) =

∫ x

−∞φ(t)dt

EX = exp(α + β2/2) og V X = exp(2α + β2)(exp(β2) − 1)

Hvis X1 ∈ LN(α1, β21) og X2 ∈ LN(α2, β

22) og Y = a · Xb

1 ·Xc2, vil for a > 0 og reelle b

og c :Y ∈ LN(log(a) + b · α1 + c · α2 , b2β2

1 + c2β22)

Resultatet kan generaliseres til alle produktkombinationer af vilkarligt mange uafhængigelog-normalfordelte variable.

17

2 Mere om Poissonfordelingen

Anvendelse af Poissonfordelingen

Poissonfordelingen benyttes til at beskrive fænomener som ’hændelser’ i et tidsforløb,’punkter’s optræden i eksempelvis planen eller i et bestemt omrade. En typisk an-vendelse er, at X angiver, hvor mange telefonopkald, der kommer i et minut til entelefoncentral. Indenfor biologien kan X angive, hvor mange ’pletter’ man finder medvækst i en agarbakke, hvor man f.eks. har strøget en vis mængde spildevand ud. An-tallet af α-partikler, som i et bestemt tidsinterval udsendes af en bestemt mængde af etradioaktivt stof, er Poissonfordelt (forudsat stoffets halveringstid er væsentligt størreend det betragtede tidsinterval).

For sadanne fænomener, som forløber i tid eller i et vist omrade, taler man ofte om enPoissonproces (med intensitet λ).

2.1 Sandsynlighedsfordeling

Poissonfordelingen har tæthedsfunktionen

f(x) = PrX = x =λx exp(−λ)

x!; x ∈ [0, 1, 2 . . . ,∞]

og dermed fordelingsfunktionen

F (x) = PrX ≤ x =x∑

i=0

λi exp(−λ)

i!; x ∈ [0, 1, 2 . . . ,∞]

Vi skriver kort X ∈ P (λ) og siger, at ’(den stokastiske variabel) X er Poissonfordeltmed intensitet λ’.

Middelværdi og varians : EX = λ , og V X = λ

2.2 Approximation

PrX ≤ x ' Φ(

x+ 12−λ√λ

), (normalfordelingen) benyttes bedst for λ ≥ 5 .

2.3 Nogle enkle egenskaber

I mange anvendelser anføres intensiteten λ som gennemsnitligt antal pr. tidsenhed,pr. arealenhed, pr. agarbakke eller lignende. Antager vi, at antal hændelser i f.eks.en tidsenhed er Poissonfordelt P (λ), da vil antallet X i et tidsinterval af længde ttidsenheder være Poissonfordelt P (t · λ).

18

Hvis X1 ∈ P (λ1) og X2 ∈ P (λ2), da vil (X1 + X2) ∈ P (λ1 + λ2). Generelt er en sumaf (uafhængige) Poissonfordelte stokastiske variable igen Poissonfordelt med summenaf intensiteterne som intensitet:

Xi ∈ P (λi) for i = 1, . . . , n =⇒n∑

i=1

Xi ∈ P (n∑

i=1

λi)

2.4 Relation til eksponentialfordelingen

Betragt en stokastisk variabel X ∈ P (λ), som angiver antal ’hændelser’ pr. tidsenhedi en Poissonproces. Vi kan nu spørge om, hvornar den næste ’hændelse’ indtræffer.Vi kan kalde den tid, der gar, for T . Størrelsen T er igen en stokastisk variabel, ogT ∈ Exp(1/λ).

2.5 Relation til χ2-fordelingen og normalfordelingen

Lad X ∈ P (λ). Der gælder følgende identitet og approximation:

F (x) = PrX ≤ x = 1 − Prχ2(2x + 2) ≤ 2λ ' 1 − Φ(λ − x − 1√

x + 1

)hvor χ2(2x+2) angiver en χ2-fordelt variabel med 2x+2 frihedsgrader. Φ(.) angiver denstandardiserede normalfordeling. Approximationen bygger pa, at χ2(f) ' N(f, 2f) ogden benyttes bedst for f > 10 (ca).

2.6 Inferens i Poissonfordelingen for en stikprøve

Betragt en stikprøve X1, X2, . . . , Xn, hvor vi antager, at Xi ∈ P (ki · λ). Dvs. n obser-vationer af Poissonfordelte variable med samme underliggende intensitet og observeretover f.eks. tidsintervaller af længder k1, k2, . . . , kn, henholdsvis. Observationerne kaldesx1, x2, . . . , xn.

Vi benytter betegnelserne x =∑n

i=1 xi og k =∑n

i=1 ki. Er specielt k1 = . . . = kn = 1 ,bliver k = n.

2.6.1 Estimation

Safremt Xi ∈ P (kiλ), er∑n

i=1 Xi ∈ P (λ∑n

i=1 ki), hvoraf

λ =

∑ni=1 xi∑ni=1 ki

=x

k

For k1 = . . . = kn = 1 findes λ = 1n

∑ni=1 xi = x. Middelværdi og varians for λ er

Eλ = λ og V λ = λ/k

19

2.6.2 Konfidensintervaller

Et eksakt tosidet (1 − α)-konfidensinterval for λ er:

I1−α(λ)tosidet =[

1

2k· χ2(2x)1−α/2 ,

1

2k· χ2(2x + 2)α/2

]

Et approximativt interval kan baseres pa normalfordelingen, idet χ2(f)p ' f +√

2f ·zp,hvor χ2(f)p angiver (1−p)-fraktilen i χ2-fordelingen med f frihedsgrader, og zp angiver(1 − p)-fraktilen i den standardiserede normalfordeling.

Noter, at i udtrykkene er f.eks. χ2(f)α/2 og zα/2 de fraktiler, som har sandsynligheds-massen α/2 til højre for sig - som benyttet i bogens tabeller!

I1−α(λ)tosidet '[x +

√x · z1−α/2

k,

x + 1 +√

x + 1 · zα/2

k

]

Et ensidet (opadtil begrænset) konfidensinterval for λ er:

I1−α(λ)opad =[

0 ,1

2k· χ2(2x + 2)α

]'[

0 ,x + 1 +

√x + 1 · zα

k

]

Et ensidet (nedadtil begrænset) konfidensinterval for λ er:

I1−α(λ)nedad =[

1

2k· χ2(2x)1−α , ∞

]'[x +

√x · z1−α

k, ∞

]

De approximative intervaller bør ikke benyttes for x < 5 og bedst er det, hvis x > 10.

2.6.3 Hypoteseprøvning

Der er tre principielt forskellige testsituationer, som alle kan undersøges ved at beregnedet relevante konfidensinterval for λ og undersøge, om det omfatter den hypotetiskeværdi λ0. Ved test pa niveau α findes:

Situation I II IIIHypotese H0: λ = λ0 H0: λ ≤ λ0 H0: λ ≥ λ0

eller λ = λ0 eller λ = λ0

Alternativ H1: λ 6= λ0 H1: λ > λ0 H1: λ < λ0

Afvis H0, hvis λ0 /∈ I1−α(λ)tosidet λ0 /∈ I1−α(λ)nedad λ0 /∈ I1−α(λ)opaddvs. hvis λ0 > 1

2kχ2(2x + 2)α/2 eller λ0 < 12kχ2(2x)1−α λ0 > 1

2kχ2(2x + 2)α

λ0 < 12kχ2(2x)1−α/2

Tilsvarende approximative tests kan baseres pa normalfordelingen:

20

Situation I II IIIHypotese H0: λ = λ0 H0: λ ≤ λ0 H0: λ ≥ λ0

eller λ = λ0 eller λ = λ0

Alternativ H1: λ 6= λ0 H1: λ > λ0 H1: λ < λ0

Afvis H0, hvis x > kλ0 + zα/2

√kλ0 eller x > kλ0 + zα

√kλ0 x < kλ0 − zα

√kλ0

x < kλ0 − zα/2

√kλ0

2.6.4 OC-funktion

Den eksakte OC-funktion for de ovenstaende tests kan beregnes pa basis af Poisson-fordelingen eller χ2-fordelingen. Et ret enkelt alternativ er imidlertid at basere sigpa en normalfordelingsapproximationer bade ved konstruktion af test og beregning afOC-funktionen. Man finder da

Situation I II IIIHypotese H0: λ = λ0 H0: λ ≤ λ0 H0: λ ≥ λ0

eller λ = λ0 eller λ = λ0

Alternativ H1: λ 6= λ0 H1: λ > λ0 H1: λ < λ0

Afvis H0, hvis x > kλ0 + zα/2

√kλ0 eller x > kλ0 + zα

√kλ0 x < kλ0 − zα

√kλ0

x < kλ0 − zα/2

√kλ0

Approximativ

OC-funktion Φ(√

k(λ0−λ)−zα/2√

λ0√λ

)Φ(√

k(λ0−λ)+zα

√λ0√

λ

)Φ(√

k(λ−λ0)+zα

√λ0√

λ

)OC(λ) ' −Φ

(√k(λ0−λ)+zα/2

√λ0√

λ

)

2.7 Inferens for to eller flere stikprøver

Betragt to stikprøve X1, X2, . . . , Xn, hvor vi antager, at Xi ∈ P (ki·λx), og Y1, Y2, . . . , Ym,hvor vi antager, at Yi ∈ P (li · λy) , dvs. n hhv. m observationer af Poissonfordeltevariable med underliggende intensiteter λx hhv. λy, der er observeret over f.eks. tidsin-tervaller af længder angivet ved ki og li. Observationerne kaldes x1, x2, . . . , xn ogy1, y2, . . . , ym. Vi benytter betegnelserne x =

∑ni=1 xi , kx =

∑ni=1 ki , y =

∑mi=1 yi og

ky =∑m

i=1 li .

Inferens for to Poissonfordelinger kan baseres pa eksakte metoder, men kan ogsa baserespa normalfordelingsapproximation og (især for tests vedkommende) pa χ2-fordelingen.

2.7.1 Estimation

Vi har λx = x/kx og λy = y/ky og dermed

λx − λy = x/kx − y/ky

med middelværdi og varians hhv.

E λx − λy = λx − λy og V λx − λy = λx/kx + λy/ky

21

2.7.2 Konfidensinterval

Et approximativt tosidet (1 − α)-konfidensinterval for λx − λy , baseret pa normal-fordelingen er :

I1−α(λx − λy) =( x

kx− y

ky

)± zα/2

√x

k2x

+y

k2y

Ensidede (1 − α)-konfidensintervaller kan konstrueres pa lignende made.

2.7.3 Sammenligning af to Poissonfordelinger

Ved sammenligning af to Poissonfordelinger benyttes ofte et test baseret pa binomial-fordelingen. Safremt X ∈ P (kx ·λx) og Y ∈ P (ky ·λy), og summen t = X +Y er givet,da vil Y være binomialfordelt:

Y|X+Y =t ∈ B(t, ρ) , hvor ρ =ky · λy

kx · λx + ky · λy

Den anførte binomialfordeling kaldes den af t = X + Y betingede fordeling for Y .

Hvis specielt λx = λy , sa er ρ = ky/(kx + ky).

Ved sammenligning af to Poissonfordelinger, hvor X ∈ P (kxλx) og Y ∈ P (kyλy), er dertre principielt forskellige situationer, som alle kan undersøges ved hjælp af ovenstaendebinomialfordeling. For niveau α tests fas:

Situation I II IIIHypotese H0: λx = λy H0: λx ≤ λy H0: λx ≥ λy

eller λx = λy eller λx = λy

Alternativ H1: λx 6= λy H1: λx > λy H1: λx < λy

Afvis H0, hvis Y > B(t, ρ0)α/2 eller Y < B(t, ρ0)1−α Y > B(t, ρ0)α

Y < B(t, ρ0)1−α/2

hvor ρ0 = ky/(kx + ky), og f.eks. B(t, ρ0)α er (1− α)-fraktil i binomialfordelingen medparametre (t, ρ0). Det vil sige, at, hvis Y ∈ B(t, ρ0), sa er B(t, ρ0)α det mindste heltal,for hvilket det gælder, at

PrY > B(t, ρ0)α ≤ α

Eksempelvis er B(20, 0.25)0.05 = 8 , fordi

PrB(20, 0.25) > 7 = 1−0.8982 ' 0.10 og PrB(20, 0.25) > 8 = 1−0.9591 ' 0.04

De viste tests kan konstrueres ved at approksimere fraktilerne i binomialfordelingenmed normalfordelingsfraktiler. Det enkleste er i ovenstaende skema at benytte, atf.eks.

B(t, ρ0)α ' t · ρ0 + zα

√t · ρ0(1 − ρ0)

og tilsvarende for de øvrige binomialfordelingsfraktiler.

22

2.7.4 Sammenligning af flere Poissonfordelinger

Betragt a Poissonfordelte stokastiske variable: X1, X2, . . . , Xa med parametre hhv.k1λ1, k2λ2, . . . , kaλa, hvor k1, k2, . . . , ka er kendte konstanter. Dvs. Xi ∈ P (kiλi) ,i = 1, . . . , a . Ved test af H0 : λ1 = λ2 = . . . = λa benyttes:

Afvis H0 for∑a

i=1(Xi−kiλ)2

kiλ> χ2(a − 1)α og accepter H0 modsætningsvis

hvor χ2(a− 1)α er (1−α)-fraktilen i χ2-fordelingen med (a− 1) frihedsgrader, og hvorλ er det fælles skøn over λ :

λ =

∑ai=1 Xi∑ai=1 ki

Testet benyttes bedst, hvis alle kiλ ≥ 5 . Testet kan naturligvis ogsa benyttes til atsammenligne to Poissonfordelinger.

2.8 Eksempel

Sæt, at der pa en cykelsti er observeret i følgende tidsperioder og fundet de angivneantal cyklister:

kl 900 − 930 kl 1000 − 1100 kl 1230 − 1245

X1 = 14 X2 = 37 X3 = 12

Pa den modsatte side af vejen er malt en anden dag og som følger:

kl 800 − 830 kl 1100 − 1130 kl 1230 − 1345 1400 − 1415

Y1 = 15 Y2 = 18 Y3 = 42 Y4 = 3

Det antages, at Xi ∈ P (kiλx), hvor ki er observationsperioden for Xi og λx er midde-lantallet af cyklister pr. time. Pa samme made antages, at Yi ∈ P (liλy). Vi finder nu,idet x =

∑xi = 63, kx =

∑ki = 1.75 time, y =

∑yi = 78 og ky =

∑li = 2.50 time:

λx =x

kx

=63

1.75= 36.00 pr time, og tilsvarende λy =

y

ky

=78

2.50= 31.20 pr time

Et 95% konfidensinterval for λx − λy er, idet z0.025 = 1.96 :

I0.95(λx − λy) =63

1.75− 78

2.50± 1.96

√63

1.752+

78

2.502= 4.80 ± 11.26 = [−6.47, 16.07]

Vi kunne ønske at undersøge, om trafikintensiteten er den samme pa de to cykelstier.Man tester H0 : λx = λy mod H1 : λx 6= λy. Da ovenstaende konfidensinterval omfatter0, kan vi umiddelbart slutte, at H0 ikke kan afvises. Vi kunne ogsa for illustrationensskyld anføre χ2-testet for problemet.

Det fælles skøn for λ er λ = x+ykx+ky

= 63+781.75+2.50

= 33.18, hvoraf

χ2 =(63 − 1.75 · 33.18)2

1.75 · 33.18+

(78 − 2.50 · 33.18)2

2.50 · 33.18= 0.42 + 0.30 = 0.72

23

Da 0.72 < χ2(2 − 1)0.05 = 3.84 , kan H0 ikke afvises (som forudset).

Med samme χ2-test metode kunne vi indledningsvis have undersøgt, om de tre X-malinger kan antages at have samme λx-værdi og ligeledes, om de fire Y -malinger kanantages at have samme λy-værdi. De to χ2-tests ville fa (3–1) hhv. (4–1) frihedsgrader.

Et 95% konfidensinterval for det fælles λ er, da x + y = 141, kx + ky = 4.25 ogz0.025 = 1.96 :

I0.95(λ) =[χ2(2 · 141)1−0.025

2 · 4.25,

χ2(2 · 141 + 2)0.025

2 · 4.25

]

'[141 − 1.96

√141

4.25,

142 + 1.96√

142

4.25

]=[27.70 , 38.91

]Vi kunne f.eks. endelig ønske at teste en hypotese som H0 : λ ≤ 25 mod H1 : λ > 25(situation II), idet vi nu betragter de to stikprøver under et. Vi finder med α = 0.05,z0.05 = 1.645, λ0 = 25, og (x+y) = 141 , (kx +ky) = 4.25 og den approximative kritiskegrænse

kλ0 + zα

√kλo = 4.25 · 25 + 1.645

√4.25 · 25 = 123.20

at, da 141 > 123.20, ma vi afvise λ ≤ 25 og modsætningsvis antage, at λ > 25 .

Vort skøn for den fælles trafikintensitet for de to cykelstier kan herefter bedst angivesved λ = 33.18 og det beregnede 95% konfidensinterval for λ :

[27.70 , 38.91

].

3 Datablade for Poisson-, binomial- og normalfordelin-

gen

3.1 Datablad for Poissonfordelingen

Poissontæthed : X ∈ P (λ) :

f(x) = PrX = x = λx exp(−λ)x!

; x ∈ [0, 1, 2 . . . ,∞]

Poissonfordeling : X ∈ P (λ) :

F (x) = PrX ≤ x =∑x

i=0λi exp(−λ)

i!; x ∈ [0, 1, 2 . . . ,∞]

Approximation:

PrX ≤ x ' Φ(

x+ 12−λ√λ

), (normalford.) benyttes bedst for λ ≥ 5 .

Middelværdi og varians : EX = λ , og V X = λ

Stikprøvefunktion for n uafhængige obs. : Xi ∈ P (λi) , i = 1, . . . , n ;X =

∑ni=1 Xi ∈ P (

∑ni=1 λi) ;

Specielt : λ1 = . . . = λn ⇒ X =∑n

i=1 Xi ∈ P (nλ) ⇒ λ = X/n approx. ∈ N(λ, λ/n)

⇒ X/n−λ√λ/n

approx. ∈ N(0, 12) ⇒ (X/n−λ)2

λ/napprox. ∈ χ2(1) , hvis nλ ≥ 5 .

24

Stikprøvefunktioner for to uafhængige stikprøver fra samme ford. : X =∑nx

i=1 Xi ∈P (nxλ) og Y =

∑ny

i=1 Yi ∈ P (nyλ) ⇒ λ = (X + Y )/(nx + ny) .

X/nx−Y/ny√λ(1/nx+1/ny)

approx. ∈ N(0, 12) ⇔ (X/nx−Y/ny)2

λ(1/nx+1/ny)approx. ∈ χ2(1) , nxλ og nyλ ≥ 5 .

X ∈ P (nxλ) og Y ∈ P (nyλ) ⇒ Y ∈ B(t, ρ) , t = X+Y , ρ = ny

nx+ny(betinget fordeling)

.

Stikprøvefunktion for k uafhængige stikprøver fra ens eller forskellige ford. :X1 ∈ P (t1λ1), . . . , Xk ∈ P (tkλk), dvs. Xi ∈ P (tiλi) , i = 1, . . . , k , og alle t1, . . . , tk erkendte positive konstanter . X =

∑ki=1 Xi ∈ P (

∑ki=1 tiλi) .∑k

i=1(Xi−tiλi)2

tiλiapprox. ∈ χ2(k) , alle t1, λ1 , ... , tk , λk forudsat kendte. Alle tiλi ≥ 5

(Spec. ti = 1) .

Generelt:∑k

i=1(Xi−tiλi)

2

tiλiapprox. ∈ χ2(k − r) , hvor r angiver antal uafhængige esti-

mater, som indgar i (λ1 , ... , λk) . Alle tiλi ≥ 5 .

Specielt : λ1 = . . . = λk = λ : λ =∑k

i=1 Xi/∑k

i=1 ti approx. ∈ N(λ, λ/∑k

i=1 ti)∑ki=1

(Xi−tiλ)2

tiλapprox. ∈ χ2(k − 1) . Alle tiλ ≥ 5 .

Specielt : X ∈ P (nxλx) og Y ∈ P (nyλy) ⇒ Y|X+Y =t ∈ B(t, ρ) , t = X + Y ,

ρ = nyλy

nxλx+nyλy( fordelingen for Y betinget af X + Y =t (binomialford.) ) .

3.2 Datablad for binomialfordelingen

Binomialtæthed : X ∈ B(n, p) :

f(x) = PX = x =(nx

)px(1 − p)n−x ; x ∈ [0, 1, 2 . . . , n]

Binomialfordeling : X ∈ B(n, p) :

F (x) = PX ≤ x =∑x

i=0

(nx

)pi(1 − p)n−i ; x ∈ [0, 1, 2 . . . , n]

Approximationer:

PX ≤ x ' Φ(

x+ 12−np√

np(1−p)

), (normalford.) benyttes bedst for np ≥ 5 .

PX ≤ x ' ∑xi=0

(np)i exp(−np)i!

, (Poissonford.) benyttes bedst for np ≤ 5 .

Middelværdi og varians : EX = n · p , og V X = n · p · (1 − p)

Stikprøvefunktion for en obs. : X ∈ B(n, p)

X/n =⇒ EX/n = p ; V X/n = p(1−p)n

=⇒ p = (X/n) approx. ∈ N(p, p(1−p)n

)

⇒ p−p√p(1−p)/n

approx. ∈ N(0, 12) , hvis np ≥ 5 .

25

Stikprøvefunktioner for to uafhængige obs. fra samme ford. : X ∈ B(nx, p) og Y ∈B(ny, p) .

X/nx−Y/ny√p(1−p)(1/nx+1/ny)

approx. ∈ N(0, 12) , p = (X + Y )/(nx + ny) , nxp og nyp ≥ 5 .

Stikprøvefunktion for k uafhængige obs. fra samme ford. : X1 ∈ B(n1, p), X2 ∈ B(n2, p), . . . , Xk ∈ B(nk, p). Generelt Xi ∈ B(ni, p) , i = 1, 2, . . . , k .

X = X1 + X2 + ... + Xk =∑k

i=1 Xi ∈ B(N, p) , hvor N =∑k

i=1 ni .∑ki=1 Xi ⇒ EX/N = p ; V X/N = p(1−p)

N⇒ p = (X/N) approx. ∈ N(p, p(1−p)

N),

for Np ≥ 5 .∑ki=1

(Xi−nip)2

nip(1−p)approx. ∈ χ2(k − 1) . Alle nip ≥ 5 .

Stikprøvefunktion for k uafhængige obs. fra ens eller forskellige ford. : X1 ∈ B(n1, p1),X2 ∈ B(n2, p2) , . . . , Xk ∈ B(nk, pk), dvs. Xi ∈ B(ni, pi) , i = 1, 2, . . . , k .

Specielt:∑k

i=1(Xi−nipi)2

nipi(1−pi)approx. ∈ χ2(k) , p1, p2 , ... , pk forudsat kendte. Alle nipi ≥ 5

Generelt:∑k

i=1(Xi−nipi)

2

nipi(1−pi)approx. ∈ χ2(k − r) , hvor r angiver antal uafhængige esti-

mater, som indgar i (p1, p2 , ... , pk) . Alle nipi ≥ 5

3.3 Datablad for normalfordelingen

Standard normaltæthed : Z ∈ N(0, 12) : φ(z) = 1√2π

exp −z2

2; z ∈ [−∞, +∞]

Standard normalfordeling : PZ ≤ z = Φ(z) =∫ z−∞ φ(t)dt ; Φ(−z) = 1 − Φ(z)

Standard normal p-fraktil zp : Φ(zp) = p , zp = −z1−p

Generel normaltæthed : X ∈ N(µ, σ2) : f(x) = 1σ√

2πexp −(x−µ)2

2σ2 ; x ∈ [−∞, +∞]

Generel normalfordeling : PX ≤ x = F (x) =∫ x−∞ f(t)dt = Φ(x−µ

σ) = 1 − Φ(−x+µ

σ)

Generel normal p-fraktil xp : F (xp) = p , xp = µ + σ · zp [= µ + σ · (−z1−p)]

Middelværdi og varians : EX = µ og V X = σ2

Stikprøve : X1, X2, . . . , Xn = x1, x2, . . . , xn i.e. n uafhængige observationer fraN(µ, σ2). Xi er en stokastisk variabel og xi det tilsvarende udfald. Xi ∈ N(µ, σ2) ,i = 1, 2, . . . , n . Den mindste værdi i stikprøven kaldes x(1) og den største x(n). Generelter x(i) den i’te mindste.

Almindeligste enstikprøvefunktioner : X = 1n

∑ni=1 Xi , S2 = 1

n−1

∑ni=1(Xi − X)2

EX = µ, V X = σ2/n, ES2 = σ2, V S2 = 2σ4/(n − 1).∑ni=1 Xi = nX =⇒ X ∈ N(µ, σ2/n) =⇒ X−µ

σ/√

n∈ N(0, 12)

26

∑ni=1(Xi − X)2 = (n − 1)S2 =⇒ (n−1)S2

σ2 ∈ χ2(ν) . Her er ν = n − 1 frihedsgrader.

X−µS/

√n∈ t(ν), hvor ν er antal frihedsgrader for S2. Her er ν = n − 1.

Median : Medx = X([n+1]/2), n ulige, eller [X(n/2) + X(n/2+1)]/2, n lige.

Almindeligste tostikprøvefunktioner : X1, X2, . . . , Xn, Y1, Y2, . . . , Ym, X, Y , S2x, S

2y

X − Y ∈ N(µx − µy, σ2x/n + σ2

y/m) =⇒ (X−Y )−(µx−µy)√σ2

x/n+σ2y/m

∈ N(0, 12)

S2x

σ2x/

S2y

σ2y∈ F (νx, νy), hvor νx = n − 1 og νy = m − 1 er frihedsgrader for S2

x og S2y hhv.

Hvis σ2x = σ2

y = σ2 : S2 =νxS2

x+νyS2y

νx+νyog ν = (νx + νy) : ν·S2

σ2 ∈ χ2(ν)

Hvis σ2x = σ2

y = σ2 : (X−Y )−(µx−µy)

S√

1/nx+1/ny∈ t(ν), hvor ν = (νx + νy) er frihedsgrader for S2.

Hvis σ2x 6= σ2

y : (X−Y )−(µx−µy)√S2

x/nx+S2y/ny

approx. ∈ t(ν),

hvor nu antal frihedsgrader ν beregnes fra data : ν ' (s2x/n+s2

y/m)2

[(s2x/n)2/(n−1)]+[(s2

y/m)2/(m−1)]

27

4 Kommenterede løsninger til opgaver. Numre og

sidetal fra 7. udgave (med 6. udg. i parentes)

4.1 Opgave 4.21, side 114 (4.19, side 111)

Nar man udtager 16 daser og optæller, hvor mange heraf, som er undervægtige, vildette antal, X, følge en binomialfordeling med n = 16, dvs X ∈ B(16, p).

Hvis færre end 3 blandt de 16 viser sig at være undervægtige, accepteres en hypoteseom, at p ≤ 0.1.

Opgaven gar nu ud pa at beregne, hvor stor sandsynligheden er for at finde færre end3 (dvs højst 2) for forskellige faktiske værdier af p.

Følgende tabel kan udlæses af bogens tabel over binomialfordelingen:

Faktisk p PBin(16, p) ≤ 20.05 0.95710.10 0.78920.15 0.56140.20 0.3518

Hvis, for eksempel, faktisk 10% af alle daser er undervægtige, er der en sandsynlighedpa lige knap 79% for, at den foreslaede kontrolmetode leder til godkendelse af daserneskvalitet (mht. indhold).

4.2 Opgave 5.91, side 190 (187)

I denne opgave skal vi bruge formlerne for middelværdi og varians, nar man læggerstokastiske variable sammen (eller trækker dem fra hinanden).

Hvis vi har to stokastiske variable, X1 og X2, hvor EX1 = µ1, V X1 = σ21, EX2 =

µ2, V X2 = σ22 , og a, b og c er tre konstanter, sa vil det gælde, at hvis Y = aX1 +

bX2 + c er en ny stokastisk variabel, sa er

EY = EaX1 + bX2 + c = aµ1 + bµ2 + c

ogV Y = V aX1 + bX2 + c = a2σ2

1 + b2σ22

Middelværdien af en konstant er konstanten selv. Variansen af en konstant er 0, dvsEc = c og V c = 0

I opgaven har vi sa:

28

Variabel Middelværdi VariansX1 µ1 = 1 σ2

1 = 5(= 2.23612)X2 µ2 = −2 σ2

2 = 5(= 2.23612)Y = X1 + 2X2 − 3 µ1 − 2µ2 − 3 = −6 σ2

1 + 22σ22 = 5 + 4 · 5 = 25 = 52

Resultatet gælder for stokastiske variable, som er uafhængige, dvs at værdier, manf.eks. maler for dem, ikke er gensidigt pavirkede (se f.eks. bogen side 185 (183)). Ikurset opererer vi gennemgaende med uafhængige stokastiske variable.

Hvis man f.eks. har variansen V X1 = σ21 = 5, svarer det til at σ1 =

√5 = 2.2361,

dvs at X1’s standard afvigelse, σ1 = 2.2361. Standard afvigelsen σ1 har samme enhedsom X1 og µ1 (f.eks. ’mg’ alle tre, hvis det er en malefejl, vi taler om).

4.3 Opgave 5.113, side 201 (197)

Nu er X en normalt fordelt stokastisk variabel, som antages at have middelværdiµ = 4.76 og varians σ2 = 0.042 (dvs standard afvigelse σ = 0.04). Kort sagt X ∈N(4.76, 0.042).

a) Vi søger PrX < 4.66 = PrN(4.76, 0.042) < 4.66som oversættes til sandsynligheden for, at en normalfordelt(4.76,0.042) stokastisk vari-abel er mindre end 4.66.

Hvis man trækker middelværdien fra en stokastisk variabel og derefter dividerer medstandard afvigelsen, far resultatet middelværdien 0 og standard afvigelsen 1 (og dermedogsa variansen 1). Dvs

PrX < 4.66 = PrX − 4.76

0.04<

4.66 − 4.76

0.04

= PrN(0, 12) < −2.50 = Φ(−2.50) = 0.0062

eftersom (4.66 − 4.76)/0.04 = −2.50, og Φ(.) angiver sandsynlighedsfordelingen forN(0, 12)-fordelingen, tabellen side 585 og 586 (574 og 575).

b) Pa samme made kan man nu finde:

PrX > 4.80 = 1 − PrX ≤ 4.80 = 1 − Φ(4.80 − 4.76

0.04)

= 1 − Φ(1.00) = 1 − 0.8413 = 0.1587

idet PrX > x = 1 − PrX ≤ x.c) og videre,

29

Pr4.70 < X < 4.82 = Pr4.70 − 4.76

0.04<

X − 4.76

0.04<

4.82 − 4.76

0.04

= Pr−1.500 < N(0, 12) < +1.500= Φ(1.500) − Φ(−1.500) = 0.9332 − 0.0668 = 0.8664

idet jo (for a < b) Pra < X < b = PrX < b − PrX < a.

4.664.66

N(4.76,0.042)

4.84.8

N(4.76,0.042)

4.7 4.82

N(4.76,0.042)

4.4 Opgave 5.116, side 201 (197)

I denne opgave skal vi benytte relationen mellem den log-normale fordeling og normal-fordelingen, nemlig at

X ∈ LN(α, β2) ⇐⇒ log(X) ∈ N(α, β2)

hvor log(X) betyder den naturlige logaritme.

−3 −2 −1 0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

N(0,1) og LN(0,1)

fordelinger

N(0,1) og LN(0,1)

fordelinger

30

Log-normalfordelingen har en lang højre hale. Nar man tager logaritmen af observa-tionerne, bliver logaritmens fordeling normal og symmetrisk. Det benytter man oftefor data med kun positive værdier, som har en lang højre hale.

I opgaven er X ∈ LN(8.85, 1.032). Vi skal finde

a)PrX > 200 = Prlog(X) > log(200) = PrY > 5.2983

hvor Y ∈ N(8.85, 1.032).

PrY > 5.2983 = PrY − 8.85

1.03>

5.2983 − 8.85

1.03 = PN(0, 1) > −3.4482 = 0.9997

idet PrN(0, 1) > −3.4482 = 1 − PN(0, 1) ≤ −3.4482 = 1 − Φ(−3.4482)

b) Pa samme made:

PrX < 300 = Prlog(X) < log(300) = PrY < 5.7038

hvor Y ∈ N(8.85, 1.032).

PrY < 5.7038 = PrY − 8.85

1.03<

5.7038 − 8.85

1.03 = PrN(0, 1) < −3.05 = Φ(−3.05) = 0.0011

4.5 Opgave 5.119, side 201 (197)

Vi har følgende data: X = 12, 30, 30, 27, 30, 39, 18, 27, 48, 24, 18. Vi ønsker at vur-dere, om det er tænkeligt, at disse data kan stamme fra en normalfordeling. I følgendefigur er tegnet den empiriske fordelingsfunktion og den normale fordelingsfunk-tion med dataenes gennemsnit og spredning som middelværdi og standard afvigelse:N(27.55, 10.022);

5 10 15 20 25 30 35 40 45 50 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Det ser for sa vidt nydeligt ud, men vi tegner nu det normalfordelings plot, der er bedtom i opgaveteksten.

31

Ordnede data x(i) 12 18 18 24 27 27 30 30 30 39 48Orden i 1 2 3 4 5 6 7 8 9 10 11pi = (i − 0.5)/11 ' 0.05 0.14 0.23 0.32 0.41 0.50 0.59 0.68 0.77 0.86 0.95Normal scores zi -1.65 -1.10 -0.75 -0.47 -0.23 0.00 0.23 0.47 0.75 1.10 1.65

Værdierne zi er udregnede, sa Φ(zi) = pi. For eksempel er Φ(0.23) = 0.59 .

Vi kan nu tegne den ønskede figur, idet der ogsa er tegnet den linie ind, som svarer tilN(27.55, 10.022)-fordelingen; den gar gennem punkterne (−2.00 , 27.55 − 2 · 10.02) og(+2.00 , 27.55 + 2 · 10.02).

5 10 15 20 25 30 35 40 45 50

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Stan

dard

−nor

mal

frac

tiles

Observations sorted

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

(i−0.5)/n

Pa baggrund af plottet vil man ikke afvise, at data med rimelighed kan antages nor-malfordelte. Pa figuren er z’erne afsat pa abscisse aksen, medens observationerne erafsat pa ordinataksen.

Læg mærke til, at z’erne er beregnet lidt anderledes end i bogen (og f.eks. ogsaanderledes end i opgave 5.95). Den viste metode anses af de fleste for den bedste.

4.6 Opgave 6.2, side 214 (210)

I 1932 havde flertallet ikke telefon. Nar man spurgte via telefoninterview, fik mankun kontakt med meget velhavende mennesker. Disse stemte imidlertid slet pa sammemade som den almindelige amerikaner.

4.7 Opgave 6.3, side 214 (210)

a) Passagerer pa et luksus-krydstogt er ikke repræsentative for folk i almindelig, menantagelig (meget) mere velhavende. De adspurgte mennesker vil antagelig angive megethøjere forbrug end gennemsnittet.

b) Det er ikke alle, som svarer tilbage. Og det er heller ikke sikkert, at de der faktisksvarer, er repræsentative for alle. Endelig er ikke sikkert, at de, der svarer er helt ærlige- maske vil de, der vil oplyse deres indkomst være tilbøjelige til at overdrive, hvis den

32

er lidt lav og omvendt for høje indkomster ?

Hvis man vil gøre det rigtigt, skal man se pa verificerbare data (skattebillet f.eks.)

c) Det stillede spørgsmal er ledende. Det “presser” svareren til at mene, at denpagældende restriktion er “unfair” (uretfærdig) og dermed, at den skal stoppes.

4.8 Opgave 6.5, side 215 (210)

Det der spørges om er, pa hvor mange mader man kan udtage netop 2 blandt 6.

Eksempel N = 6, som kunne være x1, x2, x3, x4, x5, x6. Spørgsmalet er, hvor mangepar, der kan dannes.

Par med x1 og en anden: (x1, x2) (x1, x3) (x1, x4) (x1, x5) (x1, x6)Yderligere par med x2 og en anden: (x2, x3) (x2, x4) (x2, x5) (x2, x6)Yderligere par med x3 og en anden: (x3, x4) (x3, x5) (x3, x6)Yderligere par med x4 og en anden: (x4, x5) (x4, x6)Yderligere par med x5 og en anden: (x5, x6)

Og sa kan der ikke dannes flere forskellige.

Antallet angives ved(62

)=

6!

2!(6 − 2)!=

1 · 2 · 3 · 4 · 5 · 6(1 · 2)(1 · 2 · 3 · 4)

=5 · 61 · 2 = 15

Det fundne tal angiver antallet af mader man kan sætte 6 forskellige personer i et par.

b) Pa samme made er

(252

)=

25!

2!(25 − 2)!=

1 · 2 · · · ·25

(1 · 2)(1 · 2 · · · 23)=

24 · 25

1 · 2 = 300

4.9 Opgave 6.17, side 216 (212)

I denne opgave skal vi benytte to resultater. Det ene er, hvordan vi finder fordelingenaf en sum af stokastiske variable, og det andet er, hvorledes fordelingen af en sum kanantages at være.

Endelig er der et opslag i normalfordelingen.

Vægten af en tilfældigt udvalgt person kalder vi Xi. Vi har ifølge teksten, at EXi =µ = 163 pund. Og variansen af Xi er V Xi = σ2 = 182 pund2.

Vi har nu summen af n personer

Y = X1 + X2 + . . . + Xn

33

Vi benytter formlen for en sum af stokastiske variables middelværdi og varians, f.eks.som vi benyttede den i opgave 5.91, og som det star bogen side 185 (183).

EY = µ + µ + . . . + µ = n · µ

V Y = 12 · σ2 + 12 · σ2 + . . . + 12 · σ2 = n · σ2

fordi alle X’er har middelværdien µ og variansen σ2 (de stammer alle fra samme fordel-ing, men er naturligvis ikke ens).

Ifølge Den centrale grænseværdi sætning, side 212 (208), gælder for en sum (i bogenstar der gennemsnittet, men det samme gælder selvfølgelig ogsa summen), at dentilnærmelsesvist vil følge en normalfordeling.

Er data fra starten normalfordelte, vil resultatet gælde eksakt.

Vi har altsa µ = 163 og σ2x = 182, hvoraf, da

Y =36∑i=1

Xi , at EY = 36 · 163 = 5868 og V Y = 36 · 182 = 1082

Dvs, at Y ∈ N(5868, 1082) eventuelt tilnærmelsesvist.

PrY > 6000 = 1 − PrY ≤ 6000 = 1 − PrY − 5868

108≤ 6000 − 5868

108

= 1 − PrN(0, 12) ≤ 1.222 = 1 − Φ(1.222) = 1 − 0.8888 = 0.1112

eventuelt tilnærmelsesvist (stadig pa grund af normalfordelingsantagelsen).

4.10 Opgave 6.20, side 221 (217)

Vi har altsa en stikprøve pa 25 observationer. Der er fundet et gennemsnit x = 47.5og en spredning s = 8.4.

Vi skal nu benytte vores viden om

t =x − µ

s/√

n

nemlig, at den følger en t-fordeling med (n-1) frihedsgrader (se i bogen side 216 (213)).

I vores eksempel er n=25, sa vi har en t-fordeling med 24 frihedsgrader.

Følgende figur illustrerer de 95% rimeligste værdier i en t-fordeling med 24 friheds-grader:

34

−2.064 2.064

t(24)

areal=0.025 areal=0.025

3.21

I tabellen side 587 (576) findes værdier af tα, hvor α angiver sandsynligheden til højrefor tα. For eksempel er t0.025 = 2.064. Der ligger altsa i alt sandsynligheden 0.025 ∼2.5% til højre for 2.064 i t(24)-fordelingen.

t-fordelingen er symmetrisk, sa det ’sorte’ areal er altsa tilsammen 0.025+0.025 = 0.05∼ 5%

Vi kan nu undersøge, om de fundne data svarer til ovenstaende t-fordeling, hvis µ =42.1, som postuleret.

Vi finder

t =x − µ

s/√

n=

47.5 − 42.1

8.4/√

25= 3.21

Den fundne værdi er større end 2.064, og der er altsa uoverensstemmelse mellem dataog postulatet.

Vi tror pa data og ledes derfor til at afvise postulatet, nemlig at µ = 42.1.

Vores konklusion er altsa at µ > 42.1.

Man siger, at det fundne x er signifikant større end 42.1 .

4.11 Opgave 6.21, side 221 (217)

Opgaven ligner 6.20. Vi starter med at bestemme x og s2:

x =6∑

i=1

Xi/6 = 23.0 og s2 =

∑X2

i − (∑6

i=1 Xi)2/6

n − 1= 40.80 = 6.38752

Man kan sige, at bade x og s2 er stikprøvefunktioner. De siger noget om µ og σ2 idataenes fordeling.

Hvis vi kender (eller postulerer) µ ved vi om

35

t =x − µ

s/√

n

at den følger en t-fordeling med (n-1) frihedsgrader (se i bogen side 216 (213).

I dette eksempel er n=6, sa vi har en t-fordeling med 6 − 1 = 5 frihedsgrader.

Følgende figur illustrerer de 95% rimeligste værdier i en t-fordeling med 5 frihedsgrader:

−2.571 2.571

t(5)

1.151.15

t(5)

areal=0.025 areal=0.025

Vi kan nu undersøge, om de fundne data svarer til ovenstaende t-fordeling, hvis µ =20.0, som postuleret.

Vi finder

t =x − µ

s/√

n=

23.00 − 20.00

6.3875/√

6= 1.15

Den fundne værdi er i det forventelige omrade mellem -2.571 og + 2.571. Det kan altsaikke afvises, at det gennemsnitlige tidsforbrug kan være 20 minutter.

Man kunne maske sige, at det kun er interessant, hvis afvigelsen er opad, dvs hvisµ > 20. I sa fald ville de 5% rimelige værdier være værdierne under 2.015 i t(5)-fordelingen, idet vi nu placerer alle 5% til højre (ensidet).

1.15 2.015

t(5)

areal=0.05

Ogsa ved denne ensidede vurdering vil vi ikke tvivle pa, at de 20 minutter er en rimeligangivelse.

4.12 Opgave 6.23, side 221 (218)

Vi betragter en testsituation, hvor (idet 21.3 = 4.6152)

H0 : σ2 = 4.6152 testes mod H1 : σ2 > 4.6152

36

Testet afgøres ved at at beregne s2 for 15 observationer og afvise H0, hvis s2 > 39.74.

Vi skal nu finde en stikprøvefunktion, som siger noget om s2 og σ2.

Vi har heldigvis lige netop

χ2 =

∑ni=1(Xi − X)2

σ2=

(n − 1) · s2

σ2

Ifølge bogen side 219 (215) følger denne en χ2-fordeling med (n−1) frihedsgrader, kortskrevet χ2(n − 1), som er tabelleret i bogen side 588 (577).

Vi skal nu finde

Prs2 > 39.74 = Pr(15 − 1) · s2

σ2>

(15 − 1) · 39.74

σ2

hvis σ2 = 21.3 fas

Prs2 > 39.74 = Pr(15 − 1) · s2

21.3>

(15 − 1) · 39.74

21.3

og da (15−1)·s2

21.3∈ χ2(14) fas

Pr(15 − 1) · s2

21.3> 26.12 = Prχ2(14) > 26.12 = 1 − 0.975 = 0.025

ifølge χ2-tabellen. Situationen er vist i følgende figur.

26.1226.12

χ2(14)

areal=0.025

Sandsynligheden er 2.5% for, at man afviser postulatet, σ2 = 21.3, selv om det ersandt.

Det at afvise H0, selv om H0 er sand, er at bega en type I fejl. Og vi har i opgavenfundet, at dette sker med ssh. 2.5% , som derved angiver testets signifikansniveau,dvs α = 0.025 .

37

4.13 opgave 7.4 og 7.5, side 235 (231)

Opgaven gar ud pa at angive en mulig estimationsfejl for µ, idet vi vil estimere µ vedµ = x pa sædvanlig made.

Vi benytter (ligesom i bogen side 231 (226)), at

Pr−t(n − 1)α/2 <X − µ

s/√

n< t(n − 1)α/2 = 1 − α

fordi X−µs/

√n∈ t(n − 1).

DvsPr−t(n − 1)α/2 · s/

√n < X − µ < t(n − 1)α/2 · s/

√n = 1 − α

⇐⇒Pr|X − µ| < t(n − 1)α/2 · s/

√n = 1 − α

Den maximale estimationsfejl er altsa t(n − 1)α/2 · s/√

n med konfidensgrad 1 − α.

Fra data har vi s = 14054 ud fra n = 50 observationer.

E0.95 = t(49)0.975 · 14054/√

50 = 1.96 · 14054/√

50 = 3896

Et (1 − α) konfidensinterval konstrueres pa praktisk taget samme made:

Pr−t(n − 1)α/2 · s/√

n < X − µ < t(n − 1)α/2 · s/√

n = 1 − α

⇐⇒PrX + t(n − 1)α/2 · s/

√n > µ > X − t(n − 1)α/2 · s/

√n = 1 − α

(ved at flytte X ud og gange med -1). Derved bliver intervallet

I(µ)1−α = X ± t(n − 1)α/2 · s/√

n

Fra data har vi x = 11795 og s = 14054 ud fra n = 50 observationer.

I(µ)1−α = 11795 ± 1.96 · 14054/√

50 = 11795 ± 3896 = [7899 , 15691]

4.14 Opgave 7.11, side 236 (231)

Vi har principielt samme problematik som i opgave 7.4, bortset fra, at vi nu forudsætterforhandskendskab til σ2, idet det antages, at σ2 = 1.402 (praksis ville man maskeindsamle nogle data og benytte s2 som skøn over σ2).

38

Vi kræver et konfidensniveau pa (1 − α) = 0.99, dvs at α = 1 − 0.99 = 0.01 ogα/2 = 0.005.

Vi har formlen for den maximale estimationsfejl med konfidensgrad (1 − α) og detstillede krav

E1−α = zα/2 · σ√n

≤ 0.25

som ved at isolere√

n og kvadrere giver

n ≥(zα/2 · σ

0.25

)2

Vi regner med σ = 1.40, og har det krævede z0.005 = 2.58, hvoraf

n ≥(2.58 · 1.40

0.25

)2

= 208.7 −→ 209

4.15 Opgave 7.15, side 236 (232)

I denne opgave har vi forelagt et interval [472 − 502], og vi forstiller os, at det erberegnet som et konfidensinterval.

Vi benytter (ligesom i bogen side 231 (226)), at fordi generelt X−µs/

√n∈ t(n − 1) gælder

Prt1 <X − µ

s/√

n< t2 = 1 − (α1 + α2)

hvor t1 og t2 er fraktiler i t(99)-fordelingen. Situationen er som vist i følgende figur:

t1

t2

t(99)

α1

α2

Konfidensintervallet er givet ved

PrX + t1 · s/√

n < µ < X + t2 · s/√

n = 1 − (α1 + α2)

Grænserne er altsa X + t1 · s/√

n og X + t2 · s/√

n hhv.

39

Nu har vi sa x = 487 og s = 48 baseret pa n = 100. Intervallets grænser

472 = x + t1 · s/√

n = 487 + t1 · 48/√

100 =⇒ t1 = −3.125

502 = x + t2 · s/√

n = 487 + t1 · 48/√

100 =⇒ t2 = +3.125

Nu skal vi sa sla −3.125 og +3.125 op i t(99)-fordelingen. Hvis vi gar ind i tabellenside 587 (576), ender den ved v = ’inf.’, som betyder ’infinitum’, dvs v = ∞ mangefrihedsgrader.

Men, hvis antal frihedgrader, v, bliver stort, kan vi approximere t-fordelingen med enN(0,1)-fordeling (skriv det til i tabellen!)

−4 −3 −2 −1 0 1 2 3 4−0.01

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

−3.125 3.125

N(0,12)

Fra tabellen over normalfordelingen aflæser vi, at i en N(0,1)-fordeling er der sandsyn-ligheden α1 = 0.0009 under −3.125 . Over +3.125 er der ligeledes α2 = 0.0009.

Det foreslaede intervals konfidensgrad er derfor ca 1−(α1+α2) = 1−0.0018 = 0.9982 '99.8%.

4.16 Opgave 7.24, side 237 (232)

Vi har nu data X = 2.2, 1.8, 3.1, 2.0, 2.4, 2.0, 2.1, 1.2 , og vi beregner x = 2.1000 ogs = 0.5372.

Vi benytter (som sædvanligt) et tosidet symmetrisk konfidensinterval.

Konfidensintervallet er da givet ved

PrX + t1 · s/√

n < µ < X + t2 · s/√

n = 1 − (α1 + α2)

idet t1 = −t(n − 1)α/2 og t2 = t(n − 1)α/2, dvs at t1 = −t2 .

Grænserne er altsa X − t2 · s/√n og X + t2 · s/√n hhv.

40

I opgaven er n = 8 og kravet til konfidensgraden er 1 − α = 0.95. Dvs α = 0.05 , ogα/2 = 0.025 .

Ved opslag i t-fordelingen findes t(8 − 1)0.025 = 2.365 .

Konfidensintervallet bliver derved:

I(µ)0.95 = 2.1000 ± 0.5372√8

· 2.365 = 2.1000 ± 0.4492 ' [1.65 , 2.55]

4.17 Opgave 7.28, side 244 (240)

Vi tænker os, at vi har data for emissionen x1, x2, . . . , xn , nar det pagældende’device’ er monteret. Vi kunne tænke os at benytte et t-test med n − 1 frihedsgrader.

Der er to mader at stille problemet op pa.

a) Vi vælger pa forhand at regne med, at ’device’et virker:

H0 : µ ≤ µ0 , hvor µ0 er en vis maximal emission, som vi vil tilstræbe.

H1 : µ > µ0

Type I fejlen bestar nu i, at vi gennem testet ledes til at afvise H0, selv om µ faktisker mindre end µ0 (dvs at H0 er sand).

Type II fejlen bestar i, at vi gennem testet ledes til at acceptere H0, selv om µ faktisker større end µ0 (dvs at H0 er falsk).

Hvis vi benytter den angivne kombination af H0 og H1 vil der være en vis sandsynlighedfor at opretholde H0, selv om µ faktisk er lidt over µ0. Man kan sige, at tvivlen kommerH0 tilgode.

Afvisning af H0 kræver nemlig, at x > µ0 + t(n − 1)α · s/√n, dvs at x er signifikantstørre end grænsen µ0 .

Pa denne made kan man pavise, at ’device’et ikke virker, og at µ > µ0. Det gælder,hvis man faktisk afviser H0.

b) Alternativt kunne man vælge forhandsmistanken som H0:

H0 : µ ≥ µ0 , hvor µ0 stadig er en vis maximal emission, som vi vil tilstræbe.

H1 : µ < µ0

Type I fejlen bestar nu i, at vi gennem testet ledes til at afvise H0, selv om µ faktisker større end µ0 (dvs at H0 er sand). Vi ledes altsa fejlagtigt til at tro, at device’etfungerer (godt).

Type II fejlen bestar i, at vi gennem testet ledes til at acceptere H0, selv om µ faktisker mindre end µ0, dvs at vi fejlagtigt opretholder vores mistanke.

41

Hvis vi benytter den angivne kombination af H0 og H1 vil der være en vis sandsynlighedfor at opretholde H0, selv om µ faktisk er lidt under µ0. Man kan igen sige, at tvivlenkommer H0 tilgode.

Afvisning af H0 kræver, at x < µ0 − t(n − 1)α · s/√n, dvs at x er signifikant undergrænsen µ0 .

Pa denne made kan man pavise, at ’device’et faktisk virker, og at µ < µ0. Det glder,hvis man afviser H0, som er mistanken.

De to betragtningsmader a) og b) repræsenterer to meget forskellige synsvinkler. Væl-ger man a), kommer tvivlen producenten af ’device’et tilgode. Vælger man b), kommertvivlen miljøet tilgode.

Generelt, hvis man ønsker at pavise en tilstand, skal man vælge den mod-satte som H0.

Afvisning af H0 (og dermed antagelse af H1) er det stærke udsagn.

Følgende figurer illustrerer OC-funktionerne (som angiver sandsynligheden for at opretholdeH0) i de to situationer a) og b). Abscisseværdien µ0 er den samme i de to figurer, ogden angiver den tilstræbte maximale emission.

µ0

µ1>µ

0

1.00

0.50

0.00

Sandsynlighed for atopretholde H

0i situation a)

Emission

µ1<µ

0

1.00

0.50

0.00

Sandsynlighed for atopretholde H

0i situation b)

Emission

4.18 Opgave 7.38, side 245 (241)

a) Det stærke udsagn er det udsagn, man far, nar man afviser H0 jfr opgave 7.28.

Leverandøren hævder, at den stokastiske variabel X, som er den Ohm’ske modstand iet kredsløb har en værdi som er max 50 Ω. Dens middelværdi kaldes µx.

Vi vælger nu (evt. H0 : µx = 50 eller)

H0 : µx ≥ 50 Ω og H1 : µx < 50 Ω

Hvis vi afviser H0 har vi (med en vis sikkerhed) pavist H1. Det er det, der (efterteksten at dømme) er hensigten.

42

Man vil, hvis data kan antages normalfordelte eller tilnærmelsesvist normalfordelte,benytte et t-test og reglen

Afvis H0 hvis x < 50 − t(n − 1)α · s/√n

b) Igen vil vi som agere som ’djævelens advokat’ og vælge

H0 : µ ≤ 3000 timer og H1 : µ > 3000 timer.

Hvis vi far afvist H0, kan man anse det for pavist (med en vis sikkerhed), at levetidenfaktisk er større end 3000 timer. Efter teksten at dømme er det det, der er hensigten.

Vi vil afvise H0, hvis de malte levetider ligger signifikant højere end 3000 timer gen-nemsnitligt.

4.19 Opgave 7.43, side 257 (253)

Vi har data x1, x2, . . . , xn for tidsforbruget, hvor n = 60 observationer.

H0 : µ = µ0 og H1 : µ > µ0

hvor µ0 = 32.6 minutter.

Stikprøvefunktionen er igen t = (x − µ0)/(s/√

n) og vi benytter beslutningsreglen:

Afvis H0 , hvis t > t(n − 1)α

Med n = 60 og α = 0.05 findes t(n−1)α = t(59)0.05 ' 1.645 (slaet op i normalfordelin-gen, da n er stor).

Med de fundne data bliver

t = (33.8 − 32.6)/(6.1/√

60) = 1.52

Situationen er nu som vist i følgende figur, idet det sorte areal starter ved t(59)0.05 '1.645

α = 0.05

1.52

t(59)

Da 1.52 < 1.645 kan vi ikke pa det foreliggende grundlag afvise H0.

43

4.20 Opgave 7.48, side 257 (253)

Vi har data over tjæreindhold i cigaretterne X = 14.5, 14.2, 14.4, 14.3, 14.6, og viønsker at teste cigaretternes middelindhold, µ.

Nar vi skal undersøge, hvor det faktiske middelindhold, µ, ligger i forhold til, hvad dataviser, ser vi pa stikprøvefunktionen

t =x − µ

s/√

n∈ t(n − 1)

Der star i opgaveteksten, at vi ønsker at vurdere forskellen (og ikke større end ellermindre end). Vi foretager derfor et to-sidet test i t-fordelingen med n − 1 = 4frihedsgrader.

H0 : µ = 14.0 mod H1 : µ 6= 14.0

−2.776 2.776

t(4)

α/2=0.025 α/2=0.025

De rimelige værdier for t-værdien er mellem −t(4)0.025 = −2.776 og +t(4)0.025 = 2.776, hvor 95% af fordelingen er beliggende.

Data giver x = 14.4 og s2 = 0.1582, hvoraf for µ0 = 14.0

t =14.4 − 14.0

0.158/√

5= 5.66

Vi ser, at den fundne værdi t = 5.66 ligger i det kritiske omrade, hvorfor vi forkasterH0.

Der er fundet en signifikant afvigelse fra det postulerede middelindhold pa 14.0 mg/cigaret.

4.21 Opgave 7.49, side 257 (253)

Erstattes de 14.5 med 16.0, findes nu x = 14.7 og s2 = 0.74162. Heraf

t =14.7 − 14.0

0.7416/√

5= 2.11

44

som ikke ligger i det kritiske omrade.

Arsagen til, at gennemsnittet 14.7 (som jo faktisk afviger mere fra 14.0 end 14.4 gjorde)ikke er signifikant forskellig fra 14.0, er naturligvis, at vores usikkerhedsspredning, s,er øget fra 0.158 til 0.7416.

4.22 Opgave 7.63, side 269 (265)

Vi ser pa en produktion af rotor-aksler, og (ifølge teksten) har de en middelværdiµ1 = 0.249 og en standard afvigelse σ1 = 0.003.

Akslerne skal monteres i et kugleleje, som har en huldiameter med middelværdi µ2 =0.255 og en standard afvigelse σ2 = 0.002.

Diameteren for en aksel kaldes X1 og huldiameteren for et kugleleje kaldes X2.

Clearance (forskel i aksel- og kugleleje-diamater) er Y = X2 − X1.

a) Vi har nu

EY = EX2 − EX1 = µ2 − µ1 = 0.255 − 0.249 = 0.006

V Y = (12) · V X2 + (−1)2 · V X1 = 0.0022 + 0.0032 = 0.00362

Clearance har altsa en middelværdi pa 0.006 og en standard afvigelse pa 0.0036.

b) Hvis man skal kunne montere en tilfældigt valgt aksel i et tilfældigt valgt kuglelejeskal clearance være positiv. Vi spørger derfor om

PrY > 0 = 1 − PrY ≤ 0 = 1 − PrY − 0.006

0.0036≤ 0 − 0.006

0.0036

= 1 − PrN(0, 1) ≤ 1.667 = 1 − Φ(−1.667) = 1 − 0.048 = 0.952 ∼ 95%

idet det er oplyst, at bade X1 og X2 (og dermed Y ) kan antages normalfordelte.

I teksten spørges om sandsynligheden for, at clearance er negativ. Sandsynlighedenherfor er PrY < 0 = 0.048 ' 5%.

4.23 Opgave 7.68, side 270 (266)

Vi har to forskellige metoder, A og B, til at træne nogle personer.

Man vil i reglen starte med at estimere middelværdi og varians i de to stikprøver, somher begge er pa n = 10 observationer.

Vi finder umiddelbart fra data:

µA = XA = 70.00 og σ2A = s2

A = 3.372

45

µB = XB = 74.00 og σ2B = s2

B = 5.402

Man kan beregne f.eks. 95% konfidensintervaller for µA og µB ud fra de to stikprøver:

I(µA)0.95 = 70.00 ± 3.37√10

· t(9)0.025 = 70.00 ± 2.41

I(µB)0.95 = 74.00 ± 5.40√10

· t(9)0.025 = 74.00 ± 3.86

idet t(9)0.025 = 2.262

Man kunne alternativt undersøge, om σ2A = σ2

B, og sa benytte et fælles variansskøn,hvis de kan antages ens.

Stikprøvefunktionen, man skal benytte for at vurdere dette, er beskrevet side 284 (279):

F =s2

B

s2A

∈ F (nB − 1, nA − 1)

hvis σ2A = σ2

B. Læg mærke til, at vi har stillet den største s2 i tælleren, det er nemmest,nar man skal sla op i F-fordelingen for at teste σ2

A = σ2B mod σ2

A 6= σ2B ved et tosidet

test(se s. 279 nederst).

Ved hjælp af bogens F-tabel kan man kun foretage et α = 0.10 eller α = 0.02 tosidettest, fordi man kun har F0.05 og F0.01-værdier.

Vi vil f.eks. foretage et test pa niveau α = 0.05, sa vi skal benytte F0.05/2, som kanudlæses af F-tabellen i kompendiet med eksamensopgaver og løsninger:

0.248 4.03

F(9,9)

α/2=0.025α/2=0.025

Den nedre 2.5% værdi er F (9, 9)0.975, som ikke kan fas direkte i tabellen. Men dergælder generelt, at

F (v1, v2)1−α = 1/F (v2, v1)α

saledes, at F (9, 9)0.975 = 1/F (9, 9)0.025 = 1/4.03 = 0.248, som ogsa er vist i figuren.

Hvis man finder begge de kritiske værdier for F-værdien, som i figuren, er det selvfølgeligligegyldigt, hvilken af de to s2-værdier, man sætter i nævneren.

Husk, at hvis frihedsgraderne v1 og v2 ikke er ens, skal de byttes om, nar man benytterovenstaende formel. Et eksempel er

F (4, 12)0.95 = 1/F (12, 4)0.05 = 1/5.91 = 0.169

46

Følgende figur viser F(4,12)-fordelingen. De to sorte arealer er begge 0.05.

0.169 3.36

F(4,12)

Vi fortsætter nu med den konkrete opgave og tester, om varianserne i de to stikprøverkan antages at være ens ved et test pa niveau α = 0.05 og finder

F =s2

B

s2A

=5.402

3.372= 2.57 < F (9, 9)0.05/2 = 4.03

Vi kan saledes ikke afvise, at σ2A = σ2

B, og finder derfor et fælles skøn (se side 264(260)):

σ2fælles = s2

fælles =vA · s2

A + vB · s2B

vA + vB

=9 · 3.372 + 9 · 5.402

9 + 9= 4.502

hvor vA = 9 og vB = 9 er frihedsgraderne for s2A og s2

B.

Det nye fælles skøn σ2fælles = 4.502 far vA + vB = 9 + 9 = 18 frihedsgrader.

I(µA)0.95 = 70.00 ± 4.50√10

· t(18)0.025 = 70.00 ± 2.99

I(µB)0.95 = 74.00 ± 4.50√10

· t(18)0.025 = 74.00 ± 2.99

idet t(18)0.025 = 2.101

Man kan ogsa beregne et tosidet 95% konfidensinterval for differensen mellem de togruppers middelværdier (se side 266 (261)):

I(µA − µB)0.95 = (70.00 − 74.00) ± 4.50

√1

10+

1

10· t(18)0.025 = −4.00 ± 4.23

Læg mærke til, at dette 95% konfidensinterval omfatter 0. Det svarer til, at hvis viville teste H0 : µA = µB mod H1 : µA 6= µB (et tosidet test) pa signifikansniveau 5%,ville vi ikke kunne afvise H0.

Vi er nu klar til at foretage det test, som opgaveteksten lægger op til. Det er i tekstenoplyst, at de varianser σ2

A og σ2B kan antages ens. Vores test viste, at det er en rimelig

antagelse.

47

Som H0 vil man vælge, at der ikke er virkning og, hvis man sa far afvist H0, har manpavist en virkning.

H0 : µB = µA og H1 : µB > µA

t =xB − xA

sfælles

√1

nB+ 1

nA

∈ t(vfælles) hvis H0 gælder

1.7341.734

t(18)

α=0.05

Fra data har vi sfælles = 4.50, vfælles = 9 + 9 = 18 og

t =74.00 − 70.00

4.50√

110

+ 110

= 1.99 > 1.734

hvorfor vi konkluderer, at træningsmetode B er signifikant bedre end metode A.

Læg mærke til, at vi ved at afvise H0 far det stærke udsagn, nemlig, at der er signifikantforskel.

4.24 Opgave 7.69, side 270 (266)

Denne opgave er magen til opgave 7.68, sa vi gennemfører regningerne med fa kom-mentarer.

Californien: nx = 9 x = 58.00 sx = 10.29Oregon: ny = 6 y = 51.83 sy = 12.69

Test H0 : σ2x = σ2

y mod H1 : σ2x 6= σ2

y f.eks. ved α = 0.05.

F (8, 5)0.025 = 6.79 og F (8, 5)0.975 = 1/F (5, 8)0.025 = 1/4.82 = 0.207

48

0.207 6.76

F(8,5)

α/2=0.025 α/2=0.025

Fra data

F =10.442

12.692= 0.677

som ikke er beliggende i det kritiske omrade. Vi kan altsa ikke afvise H0.

Havde vi benyttet α = 0.10, havde vi fundet det kritiske omrade ved F (8, 5)0.05 = 4.82og F (8, 5)0.95 = 1/F (5, 8)0.05 = 1/3.69 = 0.27 og heller ikke her ville vi finde signifikansfor H0.

σ2fælles = s2

fælles =vx · s2

x + vy · s2y

vx + vy

=8 · 10.442 + 5 · 12.692

8 + 5= 11.362

hvor vx = 8 og vy = 5 er frihedsgraderne for s2x og s2

y.

s2fælles har vx + vy = 8 + 5 = 13 frihedsgrader.

H0 : µx = µy og H1 : µx 6= µy

t =x − y

sfælles

√1/nx + 1/ny

∈ t(13) under H0

Data giver

t =58.00 − 51.83

11.36√

1/9 + 1/6= 1.03

De kritiske værdier er ±t(13)α/2 = ±3.012 for α/2 = 0.005.

Da −3.012 < 1.03 < 3.012 er den fundne forskel (58.00-51.83) ikke signifikant vedet test pa 1% niveau. H0 kan ikke afvises.

4.25 Opgave 7.70, side 270 (266)

a) Opgaven er meget lig opgave 7.68 og 7.69, men her er det (mere end) tvivlsomt, omvi kan antage, at de to σ’er er ens.

Alloy 1: nx = 10 x = 64.67 sx = 1.787Alloy 2: ny = 10 y = 66.28 sy = 3.484

49

Test H0 : σ2x = σ2

y mod H1 : σ2x 6= σ2

y f.eks. ved α = 0.10 .

F (9, 9)0.05 = 3.18 og F (9, 9)0.95 = 1/F (9, 9)0.05 = 1/3.18 = 0.314

0.314 3.18

F(9,9)

α/2=0.05α/2=0.05

Da F = 1.7872/3.4842 = 0.263 < 0.314 afvises H0, og det konkluderes, at antageliger σ2

x < σ2y .

Vi vil nu (ifølge opgaveteksten) teste H0 : µx = µy mod H1 : µx < µy, og vi benytteropgavens metode til at udføre et approximativt t-test. Vi finder teststørrelsen

t =x − y√

s2x/nx + s2

y/ny

∈ t(f) (approximativt) under H0

hvor, idet u = s2x/nx og v = s2

y/ny ,

f =(u + v)2

u2/(nx − 1) + v2/(ny − 1)

Med de givne data findes frihedsgraderne f = 13.42 −→ 13 og

t =64.67 − 66.28√

1.7872/10 + 3.4842/10= −1.30

−1.771

t(13)

α=0.05

og den fundne t-værdi er ikke beliggende i det kritiske omrade. Vi kan ikke afvise H0

pa det foreliggende grundlag.

b) Samme principielle fremgangsmade som under a), men der bedes her om et tosidettest:

50

Bumper 1: nx = 6 x = 127.33 s2x = 24.452 (u = s2

x/nx = 99.63)Bumper 2: ny = 6 y = 129.00 s2

y = 14.212 (v = s2y/ny = 33.65)

H0 : µx = µy mod H1 : µx 6= µy g vi benytter opgavens metode til at udføre etapproximativt t-test. Vi finder

t =x − y√

s2x/nx + s2

y/ny

∈ t(f) under H0

Data viser

t =127.33 − 129.00√

24.452/10 + 14.212/10= −0.145

u = s2x/nx = 99.63 og v = s2

y/ny = 33.65 giver frihedsgraderne

f =(u + v)2

u2/(nx − 1) + v2/(ny − 1)= 8.03 −→ 8

−3.355 3.355

t(8)

α/2=0.005α/2=0.005

−0.145

og den fundne t-værdi er ikke beliggende i det kritiske omrade. Vi kan ikke afvise H0

pa det foreliggende grundlag.

4.26 Opgave 7.72, side 272 (267)

I det viste problem er der foretaget to malinger pr person. Det helt væsentlige i opgavener, at man skal ’parre’ dataene.

Dette test kaldes ofte et parret t-test.

Person Pretest Posttest D = Effekt1 209 196 -132 178 171 -73 169 170 +1: : : :

16 144 140 4

Pa den made bliver alle sammenligninger beregnet ’indenfor’ personer, medens varia-tionen ’mellem’ personer elimineres. Vi kalder differenserne indenfor personer for Di ,i = 1, 2, . . . , 16

51

Først beregnes D = −4.125 og s2D = 4.0642 med 15 frihedsgrader, idet nD = 16

differenser.

Herefter er proceduren den sædvanlige:

H0 : µD = 0 og H1 : µD < 0

µD < 0 er det stærke udsagn, nemlig at deltagerne har tabt sig.

Stikprøvefunktionen er

t =D − 0

sD/√

nD=

−4.125 − 0

4.064/√

16= −4.06

der sammenlignes med en t(16-1)-fordeling ved et ensidet α = 0.01 test (er der bedtom), idet−t(16 − 1)0.01 = −2.602 :

−2.602−2.602

t(15)

α = 0.01

Da t = −4.06 < −2.602 , afvises H0 til fordel for H1, dvs at træningsprogrammetantagelig har haft effekt (det stærke udsagn).

4.27 Opgave 8.5, side 284 (277)

Konfidensinterval for σ2 konstrueres ved hjælp af χ2-fordelingen:

ν · s2

σ2∈ χ2(ν)

hvor s2 er vores variansestimat med ν frihedsgrader. Endelig er σ2 er den teoretiskevarians, for hvilken vi søger et konfidensinterval.

Vi kan nu skrive, at

Prχ2(ν)1−α/2 ≤ ν · s2

σ2≤ χ2(ν)α/2 = 1 − α

⇐⇒Pr ν · s2

χ2(ν)1−α/2

≥ σ2 ≥ ν · s2

χ2(ν)α/2

= 1 − α

52

⇐⇒Pr ν · s2

χ2(ν)α/2

≤ σ2 ≤ ν · s2

χ2(ν)1−α/2

= 1 − α

som fastlægger (1 − α) intervallets grænser.

I vores opgave er data : 14.5, 14.2, 14.4, 14.3, 14.6, x = 14.4 og s2 = 0.1582 medν = 5 − 1 = 4 frihedsgrader.

Der efterlyses et 99% konfidensinterval, og da χ2(4)0.995 = 0.207 og χ2(4)0.005 = 14.86er situationen

0.207 14.86

χ2(4)

α/2=0.005 α/2=0.005

og intervallet er derfor

I(σ2)0.99 = [(5 − 1) · 0.1582

14.86,

(5 − 1) · 0.1582

0.207] = [ 0.0822 , 0.6952 ]

4.28 Opgave 8.9, side 289 (281)

Data opgave 7.64 side 269 (265). Her var x = 83.2 og s2 = 19.32 pa basis af n = 71observationer.

Der er bedt om at teste H0 : σ2 = σ20 mod H1 : σ2 > σ2

0 med σ20 = 152.

Det kunne tænkes, at man ville undersøge, om variansen (af en eller anden grund)var øget i forhold til tidligere, hvor man har haft en tilfredsstillende erfaringsværdi paσ2 ' 152

Stikprøvefunktionen, vi kan benytte her er

χ2 =ν · s2

σ20

∈ χ2(ν)

ν = n − 1 er frihedsgraderne for s2 .

53

90.5390.53

χ2(70)

α = 0.05

0 70

Fra data har vi

χ2 =(71 − 1) · 19.32

15.02= 115.89

med ν = n − 1 = 70 er frihedsgrader.

Det ses, at stikprøvefunktionen er beliggende i det kritiske omrade, hvorfor vi ma afviseH0 og antage, at σ2 > 15.02 .

Det næste naturlige spørgsmal, som melder sig er, hvor stor σ2 sa kan tænkes at være.Punktestimatet for σ2 er

σ2 = s2 = 19.32

Desuden vil man beregne et konfidensinterval for σ2, f.eks med konfidensgraden 1−α =0.95 .

χ2 =ν · s2

σ2∈ χ2(ν)

⇐⇒Prχ2(ν)1−α/2 ≤ ν · s2

σ2≤ χ2(ν)α/2 = 1 − α

⇐⇒Pr ν · s2

χ2(ν)α/2

≤ σ2 ≤ ν · s2

χ2(ν)1−α/2

= α

Med ν = 70, χ2(70)1−0.025 = 48.758 og χ2(70)0.025 = 95.023 , fas 95% konfidensinter-vallet for σ2 :

I(σ2)0.95 = [70 · 19.22

95.023,

70 · 19.22

48.758] = [ 16.572 , 23.132 ]

4.29 Opgave 8.15, side 289 (282)

I denne opgave skal vi sammenligne to varianser. Fra data for intensitet af lys har viberegnet for to belysningsmetoder (kunne være nogle armaturer):

Type 1 armatur: nx = 15 x = (ej oplyst) s2x = 2.72

Type 2 armatur: ny = 21 y = (ej oplyst) s2y = 4.22

Hvis man ønsker at kunne pavise, at den ene metode har en større eller mindre variansend den anden, skal man som H0 vælge, at der ikke er forskel og som alternativ vælge’det stærke udsagn’, dvs i dette tilfælde:

54

H0 : σ2x = σ2

y og H1 : σ2x < σ2

y

Det generelle resultat, vi kan benytte her, er, at for s2y med vy frihedsgrader og s2

x medvx frihedsgrader vil

s2y/σ

2y

s2x/σ

2x

∈ F (vy, vx) , hvis de to varianser σ2x og σ2

y er de faktiske

Heraf ses, ats2

y

s2x

∈ F (vy, vx) , nar H0 er sand, dvs nar σ2x = σ2

y

Fra data findes vy = 21 − 1 = 20 og vx = 15 − 1 = 14 og F (20, 14)0.01 = 3.51

2.42 3.51

F(20,14)

α=0.01

Den beregnede F-værdi er F = 4.22/2.72 = 2.42 < 3.51 og denne værdi ligger ikkei det kritiske omrade. Vi har altsa ikke kunnet pavise, at σ2

x < σ2y ved et niveau

α = 0.01 test.

Havde vi benyttet et niveau α = 0.05 test, ville den kritiske værdi være F (20, 14)0.05 =2.39, og sa ville den fundne F-værdi have været signifikat.

Jeg ville sige, at der antagelig er en vis forskel, men nogle flere data ville være en godting.

Følgende kan du tilføje i kapitel 8 i bogen:

Fra det generelle fordelingsresultat ovenfor kan vi udlede et (1 − α) konfidensintervalfor σ2

x/σ2y :

Prs2x

s2y

· F (vy, vx)1−α/2 ≤ σ2x

σ2y

≤ s2x

s2y

· F (vy, vx)α/2 = 1 − α

Vi kunne for α = 0.05 finde F (20, 14)1−α/2 = 1/F (14, 20)α/2 = 1/2.60 = 0.385 ogF (20, 14)α/2 = 2.84 og 95% konfidensintervallet :

I(σ2x/σ

2y)0.95 = [ 0.385 · 2.72/4.22 , 2.84 · 2.72/4.22 ] = [ 0.16 , 1.17 ]

og (naturligvis) tilsvarende, hvilken man nu foretrækker,

I(σ2y/σ

2x)0.95 = [

1

0.16,

1

1.17] = [ 6.29 , 0.85 ]

55

4.30 Opgave 9.1, side 297 (289)

Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, somhar en bestemt egenskab (nemlig, at erstatningskravet > $ 1200).

Vi skriver kort, at X ∈ Bin(200, p), og pa basis af en observation x = 84 ønsker vi atudtale os om sandsynlighedsparameteren p.

Estimation af p: p = x/n = 84/200 = 0.42

I figuren side 598 (587) kan et 95% konfidensinterval aflæses direkte:

Abscisseværdien 0.42 opsøges og over denne værdi aflæses konfidensintervallet pa kurvernefor ’200’ pa skalaen ude til venstre.

Man finderI(p)0.95 = [ 0.35 , 0.49 ] ca

Man kan oga benytte ’large sample’ approksimationen, dvs en approximation, som eregnet for store stikprøver. Approximationen gar pa at approksimere binomialfordelin-gen med normalfordelingen.

I(p)0.95 ' p±zα/2·√

p(1 − p)

n= 0.42±zα/2·

√0.42(1 − 0.42)

200= 0.42±0.068 = [ 0.352 , 0.488 ]

hvor α = 0.05 og zα/2 = z0.025 = 1.96 er 0.025 værdien i højre hale af N(0, 1) normal-fordelingen:

1.961.96

N(0,12)

areal=0.025

4.31 Opgave 9.2, side 297 (289)

Samme problematik, som i opgave 9.1, men nu ønsker vi at vurdere den maksimaleestimationsfejl for p baseret pa de foreliggende data.

Formlen star pa side 296 (288), og vi kunne skrive den som:

56

E1−α = zα/2 ·√

p(1 − p)

n

hvor konfidensgraden (1 − α) er medtaget for at markere, hvor sikker E er.

Idet vi erstatter p i formlen med estimatet p

E1−α = zα/2 ·√

p(1 − p)

n

For α = 0.01 er zα/2 = z0.005 = 2.575 og

E0.99 = 2.575 ·√

0.42(1 − 0.42)

200= 0.089 ' 0.09

’Large sample’ 99% konfidensintervallet for p er sa iøvrigt

I(p)0.99 = p ± E0.99 = 0.42 ± 0.089 ' [ 0.33 , 0.51 ]

Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensinter-vallet, jfr opgave 9.1.

4.32 Opgave 9.10, side 298 (290)

Vi har igen en binomialfordeling og den maksimale estimationsfejl

E1−α = zα/2 ·√

p(1 − p)

n

Hvis vi ønsker en vis (maksimal) estimationsfejl ved konfidensniveau α, finder vi (vedat isolere n) relationen :

n = p(1 − p) ·(

zα/2

E1−α

)2

som er størst mulig for p = 0.5 .

For α = 0.05 er zα/2 = z0.025 = 1.96. Da der er krævet E1−α = E0.95 ≤ 0.06, findeskravet til n som

n ≥ 0.5(1 − 0.5) ·(

1.96

0.06

)2

= 266.8 → 267

57

4.33 Opgave 9.11, side 298 (290)

Hvis man tror, at p ≥ 0.75, findes i stedet

n ≥ 0.75(1 − 0.75) ·(

1.96

0.06

)2

= 200.1 → 201

4.34 Opgave 9.19, side 306 (298)

Der er igen tale om binomialfordelingen. Opgaven gar ud pa først at konstruere et testog derefter undersøge, om de fundne data understøtter H0 : p = 0.30. Man tester nusædvanligvis H0 : p ≤ 0.30, da man aldrig i praksis vil kende p præcist.

Testet bliver det samme, dvs

H0 : p ≤ 0.30 mod H1 : p > 0.30.

Stikprøvefunktion

Z =X − n · p0√np0(1 − p0)

∈approx N(0, 1)

dvs at Z approximativt følger en N(0, 1) fordeling.

Testet er ensidet, og vi forkaster H0 for store værdier af Z, dvs for Z > zα = 1.645for α = 0.05

1.6451.645

N(0,12)

2.19

α=0.05

Vi har nu observeret x = 47 for n = 120, og vi vil teste p0 = 0.30.

Z =47 − 120 · 0.30√

120 · 0.30(1 − 0.30)= 2.19

som er beliggende i det kritiske omrade. Vi forkaster derfor H0 og antager H1 : p >0.30.

I en praktisk situation ville vi nu anføre et skøn og et konfidensinterval for p. Vi villefinde p = 47/120 = 0.3917 og et approximativt tosidet 95% interval ville blive

I(p)0.95 = 0.3917 ± 1.96 ·√

0.3917(1 − 0.3917)

120

58

Intervallet er approximativt, fordi det bygger pa normalfordelingstilnærmelsen til bi-nomialfordelingen.

4.35 Opgave 9.28, side 307 (299)

Som opgaven er formuleret, er den et simpelt eksempel pa test i en antalstabel.

Vi har to binomialfordelte variable, X og Y , med sandsynlighedsparametre px og py.

Vi ønsker at teste H0 : px = py mod H1 : px 6= py .

Observerede antal (oij) Baseball uds. Underholningsuds. I altHusket reklame 64 75 139Ikke husket reklame 116 105 221I alt 180 180 360

Hvis H0 er sand, vil vi estimere p ved p = 139/360 = 0.3861, og sa kan vi skønne, hvormange svar der i middel ville være i de 2 × 2 kategorier i ovenstaende skema

Forventede antal (skøn) (eij) Baseball uds. Underholningsuds. I altHusket reklame 69.5 69.5 139Ikke husket reklame 110.5 110.5 221I alt 180 180 360

For eksempel er 180 · 139/360 = 180 · 0.3861 = 69.5.

Som stikprøvefunktion kan vi nu beregne χ2-værdien for forskellen mellem de to tabeller

χ2 =2∑

i=1

2∑j=1

(oij − eij)2

eij∈ χ2((2 − 1)(2 − 1)) = χ2(1)

dvs, at hvis H0 er sand, vil χ2-værdien følge en χ2-fordeling med 1 frihedsgrad.

Bidrag til χ2-værdi Baseball uds. Underholningsuds.Husket reklame 0.4353 0.4353Ikke husket reklame 0.2738 0.2738

og χ2 = 0.4353+0.4353+0.2738+0.2738 = 1.4182, som kræves mindre end χ2(1)0.05 =3.841 :

1.4182 3.841

χ2(1)

0

α=0.05

59

Da χ2-værdien ikke ligger i det kritiske omrade, kan vi ikke pa det foreliggende grundlagafvise H0.

Det samme test kunne være opnaet ved at benytte den direkte sammenligning mellemto andele generelt ved hjælp af den approximativt normalfordelte størrelse :

Z =X/nx − Y/ny − (px − py)√

px(1 − px)/nx + py(1 − py)/ny

hvori vi sætter px = py og estimerer det fælles p med p = (X + Y )/(nx + ny).

Derved fas stikprøvestørrelsen (se side 304 (296)):

Z =X/nx − Y/ny√

p(1 − p)(1/nx + 1/ny)

Ønsker man at teste H0 : px = py mod H1 : px 6= py (tosidet test) far man kritiskomrade, som vist i følgende figur, dvs |Z| > z0.025 = 1.96 :

−1.96 1.96

N(0,12)

α/2=0.025α/2=0.025

Dette test er i virkeligheden det samme test, som det viste χ2(1)-test, fordi faktiskZ2 = χ2 og (zα/2)

2 = χ2(1)α (f.eks. 1.962 = 3.84).

Ønsker man at teste H0 : px ≤ py mod H1 : px > py , dvs et ensidet test, far mankritisk omrade som vist i følgende figur, dvs Z > z0.05 = 1.645 :

1.6451.645

N(0,12)

α=0.05

Fordelen ved den sidste formulering er altsa, at man kan teste ensidet, hvilket χ2(1)-testet ikke umiddelbart kan gøre (man skal ihvertfald lige tænke sig om en ekstra

60

gang).

4.36 Opgave 9.29, side 307 (299)

Som opgaven er formuleret, er den, ligesom opgave 9.28, et eksempel pa test i enantalstabel, hvor vi nu ønsker at undersøge, om tre binomialfordelinger kan være ensmht. sandsynlighedsparameteren p.

Vi har altsa tre binomialfordelte variable, X1, X2 og X3, med sandsynlighedsparametrep1, p2 og p3.

Vi ønsker at teste H0 : p1 = p2 = p3 mod H1 : p’erne er ikke ens.

Observerede antal (oij) Agency 1 Agency 2 Agency 3 I altFor planen 67 84 109 260Imod 33 66 41 140I alt 100 150 150 400

Hvis H0 er sand, vil vi estimere det fælles p ved p = 260/400 = 0.65, og sa kan viskønne, hvor mange svar der i middel ville være i de 2 × 3 kategorier i ovenstaendeskema

Forventede antal (skøn) (eij) Agency 1 Agency 2 Agency 3 I altFor planen 65.0 97.5 97.5 260Imod 35.0 52.5 52.5 140I alt 100 150 150 400

For eksempel er 100 · 260/400 = 100 · 0.65 = 65.0.

Som stikprøvefunktion kan vi nu beregne χ2-værdien for forskellen mellem de to tabeller:

χ2 =2∑

i=1

3∑j=1

(oij − eij)2

eij

∈ χ2((2 − 1)(3 − 1)) = χ2(2)

dvs, at hvis H0 er sand, vil χ2-værdien følge en χ2-fordeling med 2 frihedsgrader.

Bidrag til χ2-værdi Agency 1 Agency 2 Agency 3For planen 0.0615 1.8692 1.3564Imod 0.1143 3.4714 2.5190

og χ2 = 0.0615+1.8692+1.3564+0.1143+3.4714+2.5190 = 9.3918, som sammenlignesmed den kritiske værdi χ2(2)0.01 = 9.210 :

61

9.219.21

χ2(2)

9.390

Da χ2-værdien ligger i det kritiske omrade (selv ved test pa niveau α = 0.01) ma vi padet foreliggende grundlag afvise H0, og i stedet konkludere, at fordelingen pa ’for’ og’imod’ for de tre ’Agencies’ ikke er den samme.

Ved test pa f.eks niveau α = 0.05 er den kritiske værdi 5.991.

Den fundne χ2-værdi er stærkt signifikant - siger man ofte.

4.37 Opgave 9.39, side 313 (305)

I denne opgave gar det igen ud pa at sammenligne fordelinger. I dette tilfælde er derto fordelinger, som begge har tre udfald, nemlig ’Republikaner’, ’Demokrat’ og ’Ikkebesluttet’. De to fordelinger er hhv. ’To uger før’ og ’Fire uger før’.

Observerede antal (oij) To uger Fire uger I altRepublikaner 79 91 170Demokrat 84 66 150Ikke besluttet 37 43 80I alt 200 200 400

Ved almindelig ’forholdstalsregning’ kan vi estimere, hvor mange svar der i middel villevære i de 3 × 2 kategorier i ovenstaende skema, hvis de tre fordelinger var ens:

Forventede antal (skøn) (eij) To uger Fire uger I altRepublikaner 85.00 85.00 170Demokrat 75.00 75.00 150Ikke besluttet 40.00 40.00 80I alt 200 200 400

For eksempel er 200 · 170/400 = 85.0.

Som stikprøvefunktion kan vi nu beregne χ2-værdien for forskellen mellem de to tabeller

χ2 =3∑

i=1

2∑j=1

(oij − eij)2

eij∈ χ2((3 − 1)(2 − 1)) = χ2(2)

dvs, at hvis H0 er sand, vil χ2-værdien følge en χ2-fordeling med 2 frihedsgrader.

62

Bidrag til χ2-værdi To uger Fire ugerRepublikaner 0.4235 0.4235Demokrat 1.0800 1.0800Ikke besluttet 0.2250 0.2250

og χ2 = 0.4235+ 0.4235+ 1.0800+ 1.0800+ 0.2250+ 0.2250 = 3.4570, som ved test paniveau α = 0.05 kræves mindre end χ2(2)0.05 = 5.991 :

5.9913.457

χ2(2)

α=0.05

Da χ2-værdien ikke ligger i det kritiske omrade, kan vi ikke pa det foreliggende grundlagafvise H0. Det betyder, at opinionen ikke er signifikant ændret fra fire til to uger førdet pagældende valg.

Man kunne f.eks interessere sig for andelen af samtlige vælgere, som agter at stemmerepublikansk. Kaldes denne andel pR, kan vi estimere denne ved pR = 170/400 =0.4250, og et 95% konfidensinterval for denne størrelse ville blive I(pR)0.95 = 0.4250 ±1.96

√0.4250(1 − 0.4250)/400 (se side 295 (287)).

4.38 Opgave 9.41, side 314 (306)

I denne opgave gar det ud pa at undersøge, om de to kvalitetskriterier ’Fidelity’ og’Selectivity’ er relaterede til hinanden. Man kunne forestille sig, at en høj værdi afdet ene kriterium ofte var sammenfaldende med en høj værdi af det andet kriterium(positivt sammenfald) eller det modsatte (negativt sammenfald).

Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i’te række ved ri ogsandsynligheden for, at et emne kategoriseres i den j’te søjle ved sj.

Sandsynligheden for at et emne pa samme tid kategoriseres i i’te række og j’te søjlekaldes endelig pij .

Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres:

H0 : pij = ri · sj mod H1 : Alle alternativer

63

FidelityObserverede antal (oij) Lav Middel Høj I altLav selectivitet 6 12 32 50Middel selectivitet 33 61 18 112Høj selectivitet 13 15 0 28I alt 52 88 50 190

Vi kan estimere ri’erne og sj ’erne:

r =

50/190112/19028/190

=

0.26320.58950.1474

og s =

52/19088/19050/190

=

0.27370.46320.2632

De skønnede forventede antal i ’cellerne’ er eij = n · ri · sj .

Ved at regne lidt pa det, ser vi, at vi igen ved almindelig ’forholdstalsregning’ kanestimere, hvor mange observationer, der i middel ville være i de 3 × 3 kategorier iovenstaende skema:

FidelityForventede antal (skøn) (eij) Lav Middel Høj I altLav selectivitet 13.68 23.16 13.16 50Middel selectivitet 30.65 51.87 29.47 112Høj selectivitet 7.66 12.97 7.37 28I alt 52 88 50 190

For eksempel er 190 · r1 · s1 = 190 · (50/190) · (52/190) = 50 · 52/190 = 13.68

Som stikprøvefunktion kan vi nu beregne χ2-værdien for forskellen mellem de to tabeller:

χ2 =3∑

i=1

3∑j=1

(oij − eij)2

eij∈ χ2((3 − 1)(3 − 1)) = χ2(4)

dvs, at hvis H0 er sand, vil χ2-værdien følge en χ2-fordeling med 4 frihedsgrader.

(fortsæt pa næste side)

FidelityBidrag til χ2-værdi Lav Middel HøjLav selectivitet 4.31 5.38 26.97Middel selectivitet 0.18 1.61 4.46Høj selectivitet 3.72 0.32 7.37

og χ2 = 4.31 + 5.38 + . . . + 7.37 = 54.32, som ved test pa niveau α = 0.01 krævesmindre end χ2(4)0.01 = 13.277 for at opretholde H0.

64

13.2779.488

χ2(4)

α=0.05

α=0.01

Da χ2-værdien (54.32) ligger (langt ude) i det kritiske omrade, ma vi afvise H0.

Den kritiske værdi for test pa niveau α = 0.05 er indtegnet for illustrationens skyld.

Den fundne χ2-værdi er stærkt signifikant, og man ma afvise hypotesen om uafhængighedmellem de to kvalitetskriterier.

I praksis kunne det betyde, at de to kvalitetsegenskaber ’Fidelity’ og ’Selectivity’ i envis udstrækning er knyttet til de samme komponenter i det undersøgte apparat.

I eksemplet giver det sig udslag i, at apparater med lav ’Selectivity’ gennemgaende harhøjere ’Fidelity’, mens apparater med høj ’Selectivity’ gennemgaende har lav ’Fidelity’.

Man kunne f.eks interessere sig for andelen af samtlige emner, som kategoriseres som(Lav Selectivity, Høj Fidelity).

Kaldes denne andel pLH , kan vi estimere denne ved pLH = 32/190 = 0.1684, og et 95%konfidensinterval for denne størrelse ville blive (se side 295 (287)):

I(pLH)0.95 = 0.1684 ± 1.96√

0.1684(1 − 0.1684)/190

4.39 Opgave 9.47, side 315 (307)

Denne opgave illustrerer en hyppigt anvendt metode til at undersøge, om en empiriskfordeling kan tænkes at være udfald fra en given type fordeling. Der benyttes et χ2-testi en antalstabel.

I det givne tilfælde ønsker man at undersøge, om data kan tænkes at være normal-fordelte.

Først estimeres den normalfordeling, der kan være tale om, idet observationernes gen-nemsnit og spredning beregnes, dvs (som opgivet i teksten) :

µ = x = 18.85 og σ2 = s2 = 30.77 = 5.552

For de viste klasser beregnes et skøn over, hvor mange observationer, der gennemsnitligtville falde i dem, hvis de n observationer stammede fra en normalfordeling med µ ogσ2 som parametre.

65

8.9512.95

N(18.85,5.552)

Estimeret antal= 8.50

Observeret antal

n2 = 10

x 80

I figuren er det sorte areal skønnet antal observationer mellem 8.95 og 12.95, medens’kassen’ angiver, hvor mange, der faktisk blev fundet.

Det sorte areal er i vores eksempel:

n2 = n × Pr8.95 ≤ N(18.85, 5.552) ≤ 12.95

Det vil sige, med n = 80 :

n2 = 80 ×[Φ(

12.95 − 18.85

5.55

)− Φ

(8.95 − 18.85

5.55

)]= 8.50

Denne beregning er udført i følgende tabel for alle klasserne:

Klasse Malt Klasse- Øvre standar- Φ(.) Skønnet Skønnet antalnr. antal: ni grænser diserede (øvre grænse) andel: pi ni = n · pi

1 3 (−∞) − 8.95 −1.784 0.0372 0.0372 2.982 10 8.95 − 12.95 −1.063 0.1439 0.1062 8.503 14 12.95 − 16.95 −0.342 0.3662 0.2223 17.784 25 16.95 − 20.95 +0.378 0.6473 0.2811 22.495 17 20.95 − 24.95 +1.099 0.8641 0.2168 17.346 9 24.95 − 28.95 +1.820 0.9656 0.1015 8.127 2 28.95 − (+∞) +∞ 1.0000 0.0344 2.75

Klassegrænserne er beregnet med et betydende ciffer mere (0.05) end dataene er malt i.Sa er der ikke tvivl om, hvor en observation skal placeres (bedre end i opgaveteksten!).

Øvre standardiserede grænse er (øvre grænse−x)/s. F.eks findes i det andet interval(8.95 - 12.95) værdien (12.95 − 18.85)/5.55 = −1.063.

Herfor findes nu Φ(.) = PrN(0, 1) ≤ (øvre grænse − x)/s. F.eks er Φ(−1.063) =0.1439

Den relative andel af observationerne, som er beliggende i f.eks klasse 2 er derefter

p2 = Φ(−1.063) − Φ(−1.784) = 0.1439 − 0.0372 = 0.1062

og det skønnede samlede antal er n2 = 80 · p2 = 8.50

Vi kan nu beregne χ2-værdien for forskellen mellem de malte og de estimerede antal:

66

Klasse Malt Skønnet antal χ2

nr. antal: ni ni = n · pi bidrag1 3 2.98 0.00012 10 8.50 0.26473 14 17.78 0.80364 25 22.49 0.28015 17 17.34 0.00676 9 8.12 0.09547 2 2.75 0.2045

I alt 80 ∼ 80 1.6552

χ2 =7∑

i=1

(ni − ni)2

ni

Antal frihedsgrader er k − 1 − r, hvor k er antal klasser og r er antal parametre, vihar estimeret for at finde klassefordelingen. Her er k = 7 klasser, og r = 2 parametre(nemlig µ og σ2).

9.4881.6552

χ2(4)

α=0.05

Den fundne χ2(4)-værdi er ikke beliggende i det kritiske omrade, og der er altsa ikkegrund til at afvise hypotesen om, at data kan være normalfordelte.

Ofte forlanger man, at der i middel skal være mindst ca 5 i alle klasser. Man ser, atdet knap gælder i de to yderste klasser. Disse kan da slas sammen med de næstyderste

Klasse Malt Skønnet antal χ2

nr. antal: ni ni = n · pi bidrag1 + 2 3 + 10 = 13 2.98 + 8.50 = 11.48 0.2013

3 14 17.78 0.80364 25 22.49 0.28015 17 17.34 0.0067

6 + 7 9 + 2 = 11 8.12 + 2.75 = 10.87 0.0016I alt 80 ∼ 80 1.2933

De 1.2933 sammenlignes med χ2(5−3)0.05 = 5.991, og heller ikke her er der signifikansmod hypotesen om normalfordelte data.

Det vil f.eks. være rimeligt at basere videre analyser af data pa en antagelse om, atdata stammer fra en normalfordeling. Det kan man have glæde af, hvis man f.eks. vilestimere og/eller teste midddelværdi og/eller varians.

67

4.40 Opgave 11.4 side 352 (11.2, side 345)

Opgaven bestar i at foretage en regressionsanalyse. Først afbildes data som i følgendefigur, der viser de undersøgte emners forlængelse i afhængighed af den belastning,de har været udsat for. Samtidig er indtegnet en linie som model for den teoretiskesammenhæng.

0 1 2 3 4 5 6 70

10

20

30

40

50

60

70

80

90

100

Linie : y = α + β x

x

y

Data ligger nydeligt omkring linien, hvorfor det er rimeligt at benytte modellen

Yi = α + βxi + εi ; i = 1, .., 6

For de viste data er∑xi = 21 ,

∑x2

i = 91 ,∑

yi = 311 ,∑

y2i = 19855 ,

∑xiyi = 1342

Sxx =∑

(xi−x)2 = 91−212/6 = 17.50 , Sxy =∑

(xi−x)(yi−y) = 1342−(21·311)/6 = 253.50

og Syy =∑

(yi − y)2 = 19855 − 3112/6 = 3734.83

β = Sxy/Sxx = 14.49 og α = y − β · x = 1.13

Dvsy = 1.13 + 14.49 · x

Vi bør altid estimere variansen for de tilfældige afvigelser, εi. Hertil benyttes formlenfor kvadratafvigelsessummen mellem data, yi, og de tilsvarende punkter pa den bereg-nede linie, yi: ∑

(yi − yi)2 = Syy − S2

xy/Sxx = 62.70

hvor de skønnede regressionsværdier altsa star for yi = α + βxi. Endelig finder vi sa

σ2ε =

∑(yi − yi)

2

n − 2=

62.70

6 − 2= 15.68 = 3.962

For regressionslinien kan man beregne f.eks et 95% konfidensinterval for liniens be-liggenhed. Vi har formlen side 349 (342):

I[ y(x0) ]1−α = α + βxi ± σε · t(n − 2)α/2 ·√

1

n+

(x0 − x)2

Sxx

68

Hvis man beregner intervallet for alle x0-værdier fas et plot som følger

0 1 2 3 4 5 6 70

10

20

30

40

50

60

70

80

90

100

Linie : y = α + β x

x

y

Med 95% konfidensinterval

interval for x0=3.50

For alle x0-værdier kan man beregne f.eks et 95% prediktionsinterval for en enkeltmalings beliggenhed. Vi har formlen side 350 (343):

I[ y(x0) + ε ]1−α = α + βxi ± σε · t(n − 2)α/2 ·√

1 +1

n+

(x0 − x)2

Sxx

Hvis man beregner intervallet for alle x0-værdier fas et plot som følger

0 1 2 3 4 5 6 70

10

20

30

40

50

60

70

80

90

100

Linie : y = α + β x

x

y

Med 95% prediktionsinterval

interval for x0=3.50

Det er vigtigt at holde de to intervaller ude fra hinanden. Konfidensintervallet ud-taler sig om den teoretiske sammenhængs (liniens) beliggenhed. Prediktionsintervalletudtaler sig om, hvor man kan forvente en fremtidig observation vil falde.

Specielt er der bedt om forudsigelse af y for x0 = 3.50. Man finder

y(3.50) = 1.13 + 14.49 · 3.50 = 51.86

95% konfidensintervallet for y(3.50) er, idet t(4)0.025 = 2.776 og σ2ε = 3.96,

I[ y(3.50) ]0.95 = 51.86 ± 3.96 · 2.776 ·√

1

6+

(3.50 − 21/6)2

17.50= 51.85 ± 4.49

95% prediktionsintervallet for y(3.50) er tilsvarende

I[ y(3.50)+ ε ]0.95 = 51.86 ± 3.96 ·2.776 ·√

1 +1

6+

(3.50 − 21/6)2

17.50= 51.85 ± 11.87

69

4.41 Opgave 11.5, side 353 (11.3, side 345)

Fortsætter opgave 11.4 :

a) Der bedes om et konfidensinterval for hældningskoefficienten β. Det generelle resul-tat, man anvender er (igen) baseret pa t-fordelingen:

β − β

=β − β

√Sxx ∈ t(n − 2)

hvorfor

Pr−t(n − 2)α/2 ≤ β − β

√Sxx ≤ t(n − 2)α/2 = 1 − α

⇐⇒Prβ − sε√

Sxx

· t(n − 2)α/2 ≤ β ≤ β +sε√Sxx

· t(n − 2)α/2 = 1 − α

og

I [ β ]1−α = β ± sε√Sxx

· t(n − 2)α/2

For α = 0.05 fas

I [ β ]0.95 = 14.49 ± 3.96√17.50

· 2.776 = 14.49 ± 2.62

Man kan pa helt samme made finde et 95% konfidensinterval for afskæringen for re-gressionslinien y = α + βx, dvs for α (se ogsa side 346 (339)):

I [ α ]0.95 = α ± sε · t(n − 2)0.025

√1

n+

(x)2

Sxx

= 1.13 ± 10.34

b) Der bedes endelig om et interval for maleresultatet for et emne, og det er netopprediktionsintervallet - som her ønskes for x0 = 3.50. Dette er besvaret i løsningen tilopgave 11.2.

Resultatet var

I [ y(3.50)+ε ]0.95 = 51.86 ± 3.96 ·2.776 ·√

1 +1

6+

(3.50 − 21/6)2

17.50= 51.85 ± 11.87

4.42 Opgave 11.6, 11.7 11.8 side 353 (11.4, 11.5 og 11.6, side

345)

Data ligger nydeligt omkring en linie, hvorfor det er rimeligt at benytte modellen

Yi = α + βxi + εi ; i = 1, .., 6

For de viste data er∑xi = 36 ,

∑x2

i = 304 ,∑

yi = 107 ,∑

y2i = 2001 ,

∑xiyi = 721

70

Sxx =∑

(xi−x)2 = 304−362/6 = 88.00 , Sxy =∑

(xi−x)(yi−y) = 721−(36·107)/6 = 79.00

og Syy = 2001 − 1072/6 = 92.83

β = Sxy/Sxx = 0.8977 og α = y − β · x = 12.45

Vi estimerer variansen af de tilfældige afvigelser, εi. Hertil benyttes yi = α + βxi ogformlen ∑

(yi − yi)2 = Syy − S2

xy/Sxx = 21.91

og endelig

σ2ε =

∑(yi − yi)

2

n − 2=

21.91

6 − 2= 5.48 = 2.342

0 5 10 150

5

10

15

20

25

30

35

40

Figuren viser data, den estimerede regressionslinie, konfidensinterval for linien, I [ y(x) ]0.95,og prediktionsinterval for enkeltmalinger, I [ y(x) + ε ]0.95.

x y y(x) I [ y(x) ]0.95 I [ y(x) + ε ]0.95

1.00 14 13.34 ± 4.36 ± 7.832.00 13 14.24 ± 3.84 ± 7.553.00 15.14 ± 3.37 ± 7.324.00 16.04 ± 2.99 ± 7.155.00 15 16.94 ± 2.74 ± 7.056.00 17.83 ± 2.65 ± 7.027.00 21 18.73 ± 2.74 ± 7.058.00 19.63 ± 2.99 ± 7.159.00 23 20.53 ± 3.37 ± 7.3210.00 21.42 ± 3.84 ± 7.5511.00 22.32 ± 4.36 ± 7.8312.00 21 23.22 ± 4.93 ± 8.1613.00 24.12 ± 5.53 ± 8.5314.00 25.02 ± 6.14 ± 8.94

I praksis bør man altid kontrollere, at afvigelserne fra den teoretiske regressionsliniefaktisk kan tænkes at stamme fra en normalfordeling. Den hyppigst anvendte og en-kleste metode er at optegne et normalfordelingsplot for de beregnede afvigelser mellemdata og den skønnede regressionslinie, dvs for residualerne

εi = yi − yi

71

Data Linie Residualeryi yi εi

13 14.24 −1.2421 18.73 +2.2723 20.53 +2.4714 13.34 +0.6615 16.94 −1.9421 23.22 −2.22

Data ordnes efter residualernes størrelse

Data Linie Residualer Orden Sandsynlighed Normal scoreyi yi ε(i) (i) pi = (i − 0.5)/n zi

21 23.22 −2.22 1 0.0833 −1.3815 16.94 −1.94 2 0.2500 −0.6713 14.24 −1.24 3 0.4167 −0.2114 13.34 +0.66 4 0.5833 0.2121 18.73 +2.27 5 0.7500 0.6723 20.53 +2.47 6 0.9167 1.38

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2−5

−4

−3

−2

−1

0

1

2

3

4

5

Residualer

Normal scores

Hvis residualernes gennemsnit kaldes ε og deres estimerede standardafvigelse kaldes σε,gar linien gennem punktet ( 0 , ε ) og har hældningkoefficienten σε.

I vores tilfælde er ε = 0 og vi fandt σε = 2.34 . I en sædvanlig regressionsanalyse(hvor der er et konstantled) vil residualernes gennemsnit iøvrigt altid være 0 (ligesomi regressionsanalysen).

Figuren viser ikke nogen pafaldende afvigelser, men antallet af observationer er lillei dette eksempel, sa det vil under alle omstædigheder være vanskeligt af efterprøvenormalfordelingsantagelsen særligt effektivt.

Eksemplets primære formal er at vise teknikken.

Vi fortsætter nu med opgaven:

I teksten til opgave 11.5 anmodes der om at undersøge estimatet for hældningskoeffi-centen β.

72

Vi harβ − β

=β − β

√Sxx ∈ t(n − 2)

Vi ønsker at teste H0 : β ≥ 1.20 mod H1 : β < 1.20

−2.132−2.132

t(4)

α=0.05−1.21

Vi har estimeret β = 0.8977, σε = sε = 2.34 og beregnet Sxx = 88.00. Heraf findest-værdien for β = 1.20:

t =0.8977 − 1.20

2.34

√88.00 = −1.21

og denne værdi er ikke beliggende i det kritiske omrade, som markeret i figuren.

Vi kan altsa ikke afvise H0 pa det foreliggende grundlag.

Man kan naturligvis ogsa teste liniens afskæring α ved hjælp af

t =α − α

=α − α

√1n

+ (x)2

Sxx

∈ t(n − 2)

For eksempel H0 : α ≤ 10.00 mod H1 : α > 10.00

t =12.45 − 10.00

2.34√

1/6 + 6.002/88.00= 1.38

som kræves større end +2.132 for kunne afvise H0 ved et test pa 5% niveau.

2.1322.132

t(4)

1.38

73

4.43 Opgave 12.6, side 414 (403)

Opgaven er en standard ensidet variansanalyse opgave. Den gar essentielt ud pa atundersøge, om de tre smøremidler fungerer lige godt, eller om der kan pavises forskellemellem dem, som afstedkommer, at bortslidning af materiale ikke er det samme for detre midler.

Man plotter gerne data som i følgende figur. Heraf fremgar, at dataenes variation-somrade indenfor de tre grupper, A, B og C, er nogenlunde lige bredt, dvs, at vari-ansen indenfor for grupperne med rimelighed kan antages ens (der findes tests for ensadan hypotese, et af dem kaldes Bartlett’s test, men der er flere).

A B C

5

10

15

20

25

Matematisk model (jfr side 405 (395)) er:

Yij = µ + αi + εij

hvor α1 + α2 + α3 = 0, og det antages, at εij ∈ N(0, σ2ε ) . µ er en konstant.

Hypoteser: H0 : α1 = α2 = α3 = 0 og H1 : Alle alternativer.

Middel Data Sum KvadratsumA 12.2 11.8 13.1 11.0 3.9 4.1 10.3 8.4 74.8 789.36B 10.9 5.7 13.5 9.4 11.4 15.7 10.8 14.0 91.4 1111.00C 12.7 19.9 13.6 11.7 18.3 14.3 22.8 20.4 133.7 2354.53

I alt 299.9 4254.89

Total kvadratafvigelsessum : SAKtot = 4254.89 − 299.92

24= 507.39

Kvadratafvigelse mellem midler : SAKmidler = 74.82+91.42+133.72

8− 299.92

24= 230.59

Kvadratafvigelse indenfor midler : SAKrest = SAKtot − SAKmidler = 276.80

Disse kvadratafvigelsessummer stilles op i følgende variansanalyseskema:

Variations- SAK Friheds s2 F-værdikilde graderSmøremidler 230.59 3 − 1 = 2 115.29 8.75Restvariation 276.80 3(8 − 1) = 21 13.18Total variation 507.39 24 − 1 = 23

Den beregnede F-værdi skal sammenlignes med en F(2,21)-fordeling: F (2, 21)0.01 =5.78

74

5.78 8.75

F(2,21)

α=0.01

og det ses, at den fundne F-værdi for smøremidler (8.75) er beliggende i det kritiskeomrade ved test pa signifikansniveauet 1% .

Vi ledes derfor til at afvise H0 og konkluderer følgelig, at middelværdierne for de tresmøremidler ikke er ens, men tværtimod er forskellige.

Konklusion :Yij = µ + αi + εij

Herefter estimerer vi nu alle modellens parametre.

Parameter Estimat Beregnes Værdiµ Y .. 299.9/24 = 12.50α1 Y 1. − Y .. 74.8/8 − 12.50 = −3.15α2 Y 2. − Y .. 91.4/8 − 12.50 = −1.07α3 Y 3. − Y .. 133.7/8 − 12.50 = 4.22σ2

ε s2rest 13.18 = 3.632

I de fleste tilfælde er man mest interesseret i middelværdierne for de enkelte grupper,dvs µi = µ+αi, og desuden vil man anføre konfidensintervaller for de enkelte gruppersmiddelværdier.

Den generelle formel for et tosidet (1 − α)-konfidensinterval for middelværdien i engruppe er:

I[ µi ]1−α = Y i. ± srest√ni

· t(frest)α/2

hvor Y i. er gennemsnittet i gruppen, ni er antal malinger i gruppen, srest er estimatetfor σε med frest frihedsgrader, og t(frest)α/2 er α/2-værdien i t-fordelingen med frest

frihedsgrader.

I

µ1

µ2

µ3

0.95

=

9.3511.4316.72

± 3.63√8

· t(21)0.025 =

9.35 ± 2.6711.43 ± 2.6716.72 ± 2.67

idet t(21)0.025 = 2.08 og 3.63√

8· 2.08 = 2.67 er samme værdi for alle tre grupper (n1 =

n2 = n3 = 8) .

De tre konfidensintervaller er indtegnet pa følgende figur

75

A B C

5

10

15

20

25

Man kan notere, at selv om intervallerne mere eller mindre overlapper hinanden, er derfundet signifikant forskel pa de underliggende middelværdier.

Der findes metoder til at undersøge, om alle middelværdier ma anses for forskellige,eller om det kan være en af de tre middelværdier, der skiller sig ud. Et sadant test erDuncans multiple range test, som ogsa er omtalt i bogen, men der findes flere sadannetests.

Afslutningsvis kunne man anføre et, eksempelvis, 95% konfidensinterval for σ2ε :

I[ σ2ε ]0.95 = [

fε · σ2ε

χ2(fε)0.025,

fε · σ2ε

χ2(fε)0.975]

hvor fε er antal frihedsgrader for estimatet σ2ε .

Her er fε = 21, σ2ε = 3.632, χ2(21)0.025 = 35.479 og χ2(21)0.975 = 10.283 , saledes at

I[ σ2ε ]0.95 = [

21 · 3.632

35.479,

21 · 3.232

10.283] = [ 2.792 , 5.042 ]

4.43.1 Model kontrol:

Ligesom i regressionsanalysen bør man kontrollere, at residualerne kan tænkes atstamme fra en normalfordeling.

Den hyppigst anvendte og enkleste metode er igen at optegne et normalfordelingsplotfor de beregnede afvigelser mellem data og den skønnede model, dvs for residualerne.

Residualerne er i vores tilfælde faktisk netop afvigelserne fra gennemsnittene indenforgrupperne, idet

εij = yij − yij = yij − µ − αi = yij − yi.

Som estimat for dataenes standardafvigelse har vi det fundne σε = 3.63

76

−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5−8

−6

−4

−2

0

2

4

6

8

Residualeropgave 12.6

Normal scores

Hvis residualernes gennemsnit kaldes ε og deres estimerede standardafvigelse kaldes σε,gar linien gennem punktet ( 0 , ε ) og har hældningkoefficienten σε.

I vores tilfælde er ε = 0 og σε = 3.63 . I en sædvanlig variansanalyse (hvor der er etkonstantled) vil residualernes gennemsnit iøvrigt altid være 0.

Figuren antyder maske lidt afvigelse fra normalfordelingen, men det vurderes, at detikke er sa dramatisk, at det anfægter analysens resultat. Hvis man vil forfølge spørgsmalet,ma man udføre et egentligt test. Man kan ogsa ga lidt nøjere ned i de enkelte residualerog eventuelt undersøge, om de største eventuelt stammer fra samme gruppe.

Jeg har godt nok ikke udført beregningerne, men er alligevel ret sikker pa, at et egentligttest for normalfordeling (blandt de tests, man normalt ville benytte) ikke vil visevæsentlig afvigelse i dette tilfælde.

4.44 Opgave 12.10, side 415 (404)

Denne opgave er helt magen til opgave 12.6, bortset fra, at antallet af malinger i deenkelte grupper varierer. Model og fremgangsmade er ligeledes , bortset fra beregningenaf kvadratafvigelsessummerne, uændrede.

Vi plotter data som i følgende figur. Heraf fremgar, at dataenes variationsomradeindenfor de fire grupper, 1, 2, 3 og 4, er nogenlunde lige bredt, dvs, at variansenindenfor for grupperne med rimelighed kan antages ens. Gruppernes gennemsnit erangivet ved en lille vandret − .

Alloy 1 Alloy 2 Alloy 3 Alloy 4

0.980

1.020

1.060

1.100

Current

77

Matematisk model (jfr side 405 (395)) er:

Yij = µ + αi + εij

hvor α1 + α2 + α3 + α4 = 0, og det antages, at εij ∈ N(0, σ2ε ) . µ er en konstant.

Hypoteser: H0 : α1 = α2 = α3 = α4 = 0 og H1 : Alle alternativer.

Legering (Data−1.000)×1000 n Sum KvadratsumAlloy 1 85 16 9 34 4 144 8718Alloy 2 51 -7 22 3 66 3134Alloy 3 -15 1 -10 -12 11 5 -25 591Alloy 4 101 15 2 116 10426

I alt 14 301 22869

Total kvadratafvigelsessum : SAKtot = 22869− 3012

14 = 16397.5

Kvadratafvigelse mellem legeringer : SAKlegering = 1442

4 + 662

3 + (−25)2

5 + 1162

2 − 3012

14 = 7017.5

Kvadratafvigelse indenfor legeringer : SAKrest = SAKtot − SAKlegering = 9380.0

Disse kvadratafvigelsessummer stilles op i følgende variansanalyseskema:

Variations- SAK Friheds s2 F-værdikilde graderLegeringer 7017.5 4 − 1 = 3 2339.2 2.49Restvariation 9380.0 14 − 4 = 10 938.0Total variation 16397.5 14 − 1 = 13

Den beregnede F-værdi skal sammenlignes med en F(3,10)-fordeling:

3.712.49

F(3,10)

6.55

F(3,10)

α=0.05 α=0.01

og det ses, at den fundne F-værdi ikke er beliggende i det kritiske omrade ved test pasignifikansniveauet 1% eller 5% (for den sags skyld).

Vi ledes derfor til at opretholde H0 og konkluderer følgelig, at middelværdierne for defire legeringer ikke er signifikant forskellige.

Konklusion : α1 = α2 = α3 = α4 = 0 , og den reducerede model er derefter

Yij = µ + εij

Herefter estimerer vi den fastlagte models parametre:

78

Parameter Estimat Beregnes Værdiµ Y .. 301/14 = 21.5σ2

ε s2total 16397.5/13 = 35.522

Vi kunne anføre, eksempelvis, 95% konfidensintervallet for den fælles middelværdi fordataene:

I[ µ ]1−α = Y .. ± σε√N

· t(N − 1)α/2

hvor Y .. er det fælles gennemsnit, N er samlet antal malinger og t(N − 1)α/2 er α/2-værdien i t-fordelingen med N − 1 frihedsgrader. Idet t(13)0.025 = 2.16 fas

I[

µ]0.95

= 21.50 ± 35.52√14

· t(13)0.025 = 21.50 ± 20.51 ' [1.0 , 42.0]

I de originale enheder er intervallet :

I[

µ]0.95

= [ 1.001 , 1.042 ] Ampere

Man kunne ogsa finde et, eksempelvis, 95% konfidensinterval for σ2ε :

I[ σ2ε ]0.95 = [

fε · σ2ε

χ2(fε)0.025,

fε · σ2ε

χ2(fε)0.975]

hvor fε er antal frihedsgrader for estimatet σ2ε . Her er fε = 10, σ2

ε = 35.522, χ2(10)0.025 =20.483 og χ2(10)0.975 = 3.247 , saledes at

I[ σ2ε ]0.95 = [

10 · 35.522

20.483,

10 · 35.522

3.247] ' [ 252 , 622 ]

I de originale enheder

I[ σ2ε ]0.95 ' [ 0.0252 , 0.0622 ] Ampere2

4.45 Opgave 12.50 side 446 (12.48, side 434)

Denne opgave er et typisk eksempel pa et randomiseret blokforsøg (randomizedblock design) med 1 maling pr. ’celle’, dvs pr. kombination af ’Agency’ og ’Site’.

Data SumSite A Site B Site C Site D Site E

Agency 1 23.8 7.6 15.4 30.6 4.2 81.6Agency 2 19.2 6.8 13.2 22.5 3.9 65.6Agency 3 20.9 5.9 14.0 27.1 3.0 70.9Sum 63.9 20.3 42.6 80.2 11.1 218.1Kvadratsum 1371.89 138.81 607.40 2177.02 41.85 4336.97

79

Den sædvanlige matematiske model er (jfr side 418 (407)):

Yij = µ + αi + βj + εij

hvor∑

i αi = 0,∑

j βj = 0, og det antages, at εij ∈ N(0, σ2ε ) . µ er en konstant.

I modellen er σ2ε variansen pa maleusikkerheden i eksperimentet. Denne omfatter dels

den variation, der er pa selve den kemiske metode dels den variation, der er mellem deprøver, som tages pa samme ’Site’.

Vi plotter data som i følgende figur. Heraf fremgar, at de tre ’Agencies’ følges nogen-lunde ad med niveauet for ’Sites’. Dette understøtter den valgte model, som forud-sætter additivitet mellem ’Agencies’ og ’Sites’ i maleresultatet (der er dog muligvisen tendens til, at der er større spredning mellem resulaterne ved høje koncetrationer;en hyppigt anvendt metode til at kompensere herfor er vist som et eksempel til sidst inærværende besvarelse).

Site 1 Site 2 Site 3 Site 4 Site 5

5

15

25

35Koncentration

Agency 1

Agency 2

Agency 3

Opgaven gar ikke ud pa at undersøge, om ’Sites’ er ens (det er de tydeligvis ikke), menderimod vil man undersøge, om de tre ’Agencies’ kan være ens, dvs finder overensstem-mende resultater, nar den koncentration, der males varierer.

Hypoteser: H0 : α1 = α2 = α3 = 0 og H1 : Alle alternativer.

Der foretages følgende beregninger:

Total kvadratafvigelsessum : SAKtot = 4336.97 − 218.12

15= 1165.80

Kvadratafvigelse mellem ’Agencies’ : SAKagency = 81.62+65.62+70.92

5− 218.12

15= 26.57

Kvadratafvigelse mellem ’Sites’ : SAKsite = 63.9220.32+42.62+80.22+11.12

3− 218.12

15= 1117.26

Kvadratafvigelse for restvariation: SAKrest = SAKtot − SAKagency − SAKsite = 21.96

Disse kvadratafvigelsessummer stilles op i følgende variansanalyseskema:

Variationskilde SAK Frihedsgrader s2 F-værdiAgencies 26.57 3 − 1 = 2 13.29 4.84Sites (blokke) 1117.26 5 − 1 = 4 279.32 (101.57)Restvariation 21.96 (3 − 1) × (5 − 1) = 8 2.75Total variation 1165.80 15 − 1 = 14

80

Den beregnede F-værdi for ’Agencies’ skal sammenlignes med en F(2,8)-fordeling:

4.46

F(2,8)

8.65

F(2,8)

4.84

α=0.05 α=0.01

Som det fremgar, er der signifikant forskel pa ’Agencies’ ved test pa 5% niveau, menikke pa 1% niveau. Man vil konkludere, at der antagelig er en vis forskel pa de tre’Agencies’.

Man kan ogsa foretage et test for, om ’Sites’ er forskellige (selv om det ikke er denprimære opgave). Da den fundne Fsites = 101.57 >> F (4, 8)0.01 = 7.01, er der (stor)forskel pa ’Sites’ (og det viste vores figur ogsa).

KonklusionYij = µ + αi + βj + εij

Herefter estimerer vi nu alle modellens parametre.

Parameter Estimat Beregnes Værdi

µ Y .. 218.1/15 = 14.54α1 Y 1. − Y .. 81.6/5 − 14.54 = 1.78α2 Y 2. − Y .. 65.6/5 − 14.54 = −1.42α3 Y 3. − Y .. 70.9/5 − 14.54 = −0.36β1 Y .1 − Y .. 63.9/3 − 14.54 = 6.76β2 Y .2 − Y .. 20.3/3 − 14.54 = −7.77β3 Y .3 − Y .. 42.6/3 − 14.54 = −0.34β4 Y .4 − Y .. 80.2/3 − 14.54 = 12.19β5 Y .5 − Y .. 11.1/3 − 14.54 = −10.84σ2

ε s2rest 2.75 = 1.662

Vi kunne være interesseret i middelværdierne for de enkelte ’Agencies’ , dvs µi = µ+αi,og konfidensintervaller for de enkelte middelværdier.

Formlen for et tosidet (1 − α)-konfidensinterval for middelværdien i en gruppe (et’Agency’) er:

I[ µi ]1−α = Y i. ± srest√ni

· t(frest)α/2

hvor Y i. er gennemsnittet i gruppen, ni er antal malinger i gruppen, srest er estimatetfor σε med frest frihedsgrader, og t(frest)α/2 er α/2-værdien i t-fordelingen med frest

frihedsgrader.

81

I

µ1

µ2

µ3

0.95

=

16.3213.1214.18

± 1.66√5

· t(8)0.025 =

16.32 ± 1.7113.12 ± 1.7114.18 ± 1.71

idet t(8)0.025 = 2.365 og 1.66√

5· 2.306 = 1.71 er samme værdi for alle tre grupper (n1 =

n2 = n3 = 5) .

De tre konfidensintervaller er indtegnet pa følgende figur, hvor data ogsa er medtaget,markeret med ’Site’ nummer. Man kan bemærke, at konfidensintervallerne ikke rigtigthar nogen mening uden, at man ogsa ved, hvilket konkret ’Site’, der er tale om (de skalaltsa følge med niveauet for det ’Site’ man er interesseret i).

1

11

2 2 2

33 3

4

4

4

5 5 5Agency 1 Agency 2 Agency 3

5

10

15

20

25

30

35

Koncentration

Man kan ogsa notere, at intervallerne overlapper hinanden en del, selv om der fundetsignifikant forskel pa de tre ’Agencies’.

Man kunne igen finde et, eksempelvis, 95% konfidensinterval for σ2ε :

I[ σ2ε ]0.95 = [

fε · σ2ε

χ2(fε)0.025,

fε · σ2ε

χ2(fε)0.975]

hvor fε er antal frihedsgrader for estimatet σ2ε .

Her er fε = 8, σ2ε = 1.662, χ2(8)0.025 = 17.535 og χ2(8)0.975 = 2.180 , saledes at

I[ σ2ε ]0.95 = [

8 · 1.662

17.535,

8 · 1.662

2.180] ' [ 1.122 , 3.182 ]

4.46 Opgave 12.54 side 447 (12.52, side 435)

Der lægges op til at undersøge, om et af de tre ’Agencies’ afviger signifikant fra de toandre.

Man kunne tænke sig at benytte et t-test for forskellen mellem par af ’Agencies’, f.eksmellem ’1’ og ’2’:

t12 =Y 1. − Y 2.

srest

√1/5 + 1/5

=1.78 − (−1.42)

1.66√

1/5 + 1/5= 3.05 > t(8)0.025 = 2.306

82

og konkludere, at ’Agency 1’ ligger signifikant højere end ’Agency 2’.

Tilsvarende ’1’ mod ’3’:

t13 =Y 1. − Y 3.

srest

√1/5 + 1/5

=1.72 − (−0.36)

1.66√

1/5 + 1/5= 1.98 < t(8)0.025 = 2.306

Tilsvarende ’3’ mod ’2’:

t32 =Y 3. − Y 2.

srest

√1/5 + 1/5

=−0.36 − (−1.42)

1.66√

1/5 + 1/5= 1.01 < t(8)0.025 = 2.306

Man kan ikke drage en entydig konklusion, men maske sige, at ’Agency 1’ muligvisligger højere end de to andre.

Hvis man skal gøre dette helt rigtigt, bør man benytte et test, som pa en gang sam-menligner flere middelværdier. Et ’Duncans multiple range test’ er et sadant test. Deter beskrevet i lærebogen (udenfor pensum).

Eksempel pa transformation (og en forbedret analyse!)

Ofte, nar man anlyserer (især kemiske) maledata, som er indbyrdes relativt megetforskellige, vil maleusikkerheden ikke være konstant pa den originale maleskala, mensnarere vil den relative usikkerhed være næsten konstant.

I sadanne tilfælde tager man gerne logaritmen af data og analyserer denne.

I opgave 12.48 kunne man benytte denne metode. Et plot af data efter logaritmering(naturlig logaritme) ses nedenfor. Man noterer, at de indbyrdes forskelle pa den log-aritmiske skala er meget ens ved de forskellige koncentrationer, sa forudsætningen omden samme varians for alle data er antagelig bedre opfyldt for de logaritmerede data:

Site 1 Site 2 Site 3 Site 4 Site 5

1

2

3

4

5

log−Koncentration

Agency 1

Agency 2

Agency 3

Variansanalysen bliver:

Variansanalyse af log-koncentrationVariationskilde SAK Frihedsgrader s2 F-værdiAgencies 0.1083 3 − 1 = 2 0.0542 6.20Sites (blokke) 8.1387 5 − 1 = 4 2.0347 (233.07)Restvariation 0.0699 (3 − 1) × (5 − 1) = 8 0.00873Total variation 8.3169 15 − 1 = 14

83

Agency 1 Agency 2 Agency 3gennemsnit log(yij) 2.5577 2.3853 2.3704

Med srest =√

0.00873 = 0.0934 findes (ved tosidet test pa 5% niveau)

t12 =2.5577 − 2.3853

0.0934√

1/5 + 1/5= 2.91 > t(8)0.025 = 2.306

t13 =2.5577 − 2.3704

0.0934√

1/5 + 1/5= 3.17 > t(8)0.025 = 2.306

t23 =2.3853 − 2.3704

0.0934√

1/5 + 1/5= 0.25 < t(8)0.025 = 2.306

Konklusionen er, at ’Agency 1’ er signifikant afvigende fra ’2’ og ’3’, som til gengældikke er væsenligt forskellige. Beregner man forskellen mellem ’1’ og de to andres gen-nemsnit findes :

log(Agency 1) - log(Agency 2 eller 3) ' 0.18 ⇐⇒ (Agency 1)/(Agency 2 eller 3) ' 1.18

Dette betyder, at maleværdierne fra ’Agency 1’ gennemsnitligt er 1.18 gange værdiernefra ’2’ eller ’3’, eller ca 18% højere. Denne forskel er statistisk signifikant.

Den relative usikkerhed ved malingerne er estimeret til 0.0934 eller svarende til ca 9%for alle data.

Denne sammenhæng mellem estimaterne for de logaritmere data og de beregnedeforskelle og relative usikkerheder for de oprindelige data kan afledes af, at log(1+r) ' r,hvis |r| << 1.

Eksempel pa en meget forkert analyse

Man kunne forestille sig, da det nu faktisk er ’Agencies’, man er interesseret i, at mansimpelthen helt ser bort fra informationen om, hvilke ’Sites’ malingerne var taget ved.

Derved far man en enklere analyse, nemlig en ensidet variansanalyse.

Data Sum KvadratsumAgency 1 23.8 7.6 15.4 30.6 4.2 81.6 1815.36Agency 2 19.2 6.8 13.2 22.5 3.9 65.6 1110.58Agency 3 20.9 5.9 14.0 27.1 3.0 70.9 1411.03

I alt 218.1 4336.97

Den tilsvarende variansanalyse bliver herefter

Variationskilde SAK Frihedsgrader s2 F-værdiAgencies 26.57 3 − 1 = 2 13.29 0.14Restvariation 1139.23 3 × (5 − 1) = 12 94.94Total variation 1165.80 15 − 1 = 14

84

Men, som det fremgar, mister man herved fuldstændigt følsomhed. Arsagen er naturligvis,at hele variationen, som stammer fra ’Sites’ tillægges restvariationen, som derved bliveralt for stor !

Den rigtige variansanalyse var som følger. Sammenligning de to skemaer!

Variationskilde SAK Frihedsgrader s2 F-værdiAgencies 26.57 3 − 1 = 2 13.29 4.84Sites (blokke) 1117.26 5 − 1 = 4 279.32 (101.57)Restvariation 21.96 (3 − 1) × (5 − 1) = 8 2.75Total variation 1165.80 15 − 1 = 14

4.47 Opgave 13.1, side 466 (455)

Opgaven er et helt klassisk faktorforsøg, hvor to faktorers indflydelse pa reflektivitetenaf en bestemt overfladebehandling ønskes undersøgt.

Data er indsamlet gennem tre forsøgsrunder (replikater). I praksis kan sadanne forsøgsrundereksempelvis gennemføres pa forskellige dage, idet man maske lige netop kan na en rundepr dag.

Faktorforsøg 75o F 100o F 125o F 150o F 175o FRunde I

Konc = 5 g/l 35 31 30 28 19Konc = 10 g/l 38 36 39 35 30

Runde IIKonc = 5 g/l 39 37 31 20 18Konc = 10 g/l 46 44 32 47 38

Runde II 1Konc = 5 g/l 36 36 33 23 22Konc = 10 g/l 41 39 38 40 31

Standardmodellen for dette forsøg er:

Yijk = µ + αi + βj + αβij + ρk + εijk

hvor∑

i αi = 0 ,∑

j βj = 0 ,∑

i αβij =∑

j αβij = 0 ,∑

k ρk = 0 , og det antages,at εijk ∈ N(0, σ2

ε ). Endelig er µ en konstant.

Temperaturens indflydelse beskrives ved αi og koncentrationens indflydelse beskrivesved βj. Bidraget αβij angiver vekselvirkningen mellem temperatur og koncentration.Endelig beskriver ρk niveauforskellene mellem de tre forsøgsrunder.

I modellen er σ2ε variansen pa forsøgsusikkerheden i eksperimentet. Denne omfatter

dels den variation, der er pa den malemetode, som anvendes, dels den variation, derfaktisk vil være mellem prøveemner, som iøvrigt er fremstillet under identiske forhold.

Data afbildes for eksempel som vist her:

85

60 80 100 120 140 160 18010

15

20

25

30

35

40

45

50

Runde I

Temperatur60 80 100 120 140 160 180

10

15

20

25

30

35

40

45

50

Runde II

Temperatur60 80 100 120 140 160 180

10

15

20

25

30

35

40

45

50

Runde III

Temperatur

Man ser, at responset falder med temperaturen bade ved koncantrationen 5 g/l (denederste grafer) og ved 10 g/l (de øverste grafer). Responset øges, nar koncentrationenøges fra 5 til 10 g/l.

De tre runder (I, II og III) ser rimeligt overensstemmende ud. En enkelt maleværdifalder lidt udenfor (nemlig runde II, 125o og 10 g/l), men det er (forhabentlig) ikkemere end, at det er rimeligt at gennemføre analysen med data, som de foreligger.

Med henblik pa at opstille variansanalysen for modellen, bestemmes først et antalrelevante summer:

Totaler 75o F 100o F 125o F 150o F 175o F SumKonc = 5 g/l 110 104 94 71 59 438Konc = 10 g/l 125 119 109 122 99 574

Sum 235 223 203 193 158 1012

Runder: Runde I Runde II Runde IIITotaler 321 352 339

Heraf beregnes

Total kvadratafvigelsessum : SAKtot =∑

ijk y2ijk − 10122

30 = 1683.87

Kvadratafvigelse for temperaturer : SAKtemp = 2352+2232+2032+1932+1582

3·2 − 10122

30 = 591.20

Kvadratafvigelse for koncentrationer : SAKkonc = 4382+5742

3·5 − 10122

30 = 616.53

Kvadratafvigelse for vekselvirkning: SAKveks = 1102+1042+942+712+...+1222+992

3 − 10122

30−SAKtemp − SAKkonc = 196.13

Kvadratafvigelse for runder: SAKrunder = 3212+3522+3392

10 − 10122

30 = 48.47

Restvariation: SAKrest = SAKtot − SAKtemp − SAKkonc − SAKveks − SAKrunder = 231.33

Disse kvadratafvigelsessummer stilles op i følgende variansanalyseskema:

Variationskilde SAK Frihedsgrader s2 F-værdi 5% kritisk 1% kritiskRunder 48.47 3 − 1 = 2 24.23 (1.88) (3.55) (6.01)Temperatur 591.20 5 − 1 = 4 147.80 11.49 2.93 4.58Koncentration 616.53 2 − 1 = 1 616.53 47.93 4.41 8.29Vekselvirkning 196.13 (5 − 1)(2 − 1) = 4 49.03 3.81 2.93 4.58Restvariation 231.53 18 12.86Total variation 1683.17 30 − 1

86

I kolonnerne ’5% kritisk’ og ’1% kritisk’ er anført de kritiske F-værdier for test paniveau 5% og 1% hhv.

Det ses, at savel temperatur som koncentration er stærkt signifikante, medens deresvekselvirkning er signifikant ved niveau 5%. ’Runderne’ er ikke signifikant forskellige,men da de ikke repræsenterer en kontrollerbar faktor (i et andet forsøg vil de generelthave andre værdier) tages de med i den endelige model:

Yijk = µ + αi + βj + αβij + ρk + εijk

Da modellen ikke kan reduceres, betyder det, at den bedste kombination af temperaturog koncentration er den, som resulterer i det højeste respons (malt reflektivitet).

Det ses, at det højeste respons opnas for (75o F og 10 g/l), hvor gennemsnittet er(38+46+41)/3 = 125/3 = 41.67 .

Et 95% konfidensinterval for responset er her, med srest =√

12.86 = 3.59 :

I[optimum]0.95 = 41.67 ± 3.59√3

· t(18)0.025 = 41.67 ± 4.35 = [ 37.32 , 46.02 ]

idet t(18)0.025 = 2.101

For responset ved samtlige kombinationer af de to faktorer, temperatur og koncentra-tion, kan vi pa samme made finde konfidensintervaller for middelresponset. Resultatetses af følgende figur:

60 80 100 120 140 160 18010

15

20

25

30

35

40

45

50

Gennemsnitligt respons

og 95% konfidensintervaller

5 g/l

10 g/l

Optimum

Temperatur

Reflektivitet

Hvis man skulle kommentere resultaterne nøjere, kunne man maske stille sig lidttvivlende overfor maleværdierne fundet for 10 g/l i runde II. I praksis ville man an-tagelig foretage endnu en eller to forsøgsrunder, hvis der var mulighed for det.

Og man kan tilføje, at det er en væsentlig fordel ved netop den forsøgsplan, der erbenyttet, at man kan udføre flere runder end planlagt fra starten, og at man derved

87

løbende kan vurdere, hvorvidt der er brug for mere information eller ej og evt. fortsætteeller stoppe maleprogrammet.

Estimation af parametrene µ, αi, βj, αβij og ρk foretages ved dannelse af passendegennemsnit:

µ = Y ... (dvs gennemsnit for alle data)

αi = Y i.. − Y ...

βj = Y .j. − Y ...

αβij = Y ij. − µ − αi − βj

ρk = Y ..k − Y ...

hvor f.eks gennemsnittet for temperatur nr ’i’ er Y i.. = (∑

j

∑k Yijk)/ni , idet ni er

antal malinger, der er foretaget ved temperatur nr ’i’ (her er ni = 6).

Man kunne afslutningsvis finde et, eksempelvis, 95% konfidensinterval for σ2ε :

I[ σ2ε ]0.95 = [

fε · σ2ε

χ2(fε)0.025,

fε · σ2ε

χ2(fε)0.975]

hvor fε er antal frihedsgrader for estimatet σ2ε .

Her er fε = 18, σ2ε = 3.592, χ2(18)0.025 = 31.526 og χ2(18)0.975 = 8.231 , saledes at

I[ σ2ε ]0.95 = [

18 · 3.592

31.526,

18 · 3.592

8.231] = [ 2.712 , 5.312 ]

88

5U

dvid

et

tabelfo

rF

-ford

elin

gen

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 5.83 7.50 8.20 8.58 8.82 8.98 9.10 9.19 9.26 9.32 9.37 9.41 9.44 9.47 9.492 2.57 3.00 3.15 3.23 3.28 3.31 3.34 3.35 3.37 3.38 3.39 3.39 3.40 3.41 3.413 2.02 2.28 2.36 2.39 2.41 2.42 2.43 2.44 2.44 2.44 2.45 2.45 2.45 2.45 2.464 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.085 1.69 1.85 1.88 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.896 1.62 1.76 1.78 1.79 1.79 1.78 1.78 1.78 1.77 1.77 1.77 1.77 1.77 1.76 1.767 1.57 1.70 1.72 1.72 1.71 1.71 1.70 1.70 1.69 1.69 1.69 1.68 1.68 1.68 1.688 1.54 1.66 1.67 1.66 1.66 1.65 1.64 1.64 1.63 1.63 1.63 1.62 1.62 1.62 1.629 1.51 1.62 1.63 1.63 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.58 1.58 1.57 1.5710 1.49 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.55 1.54 1.54 1.54 1.5311 1.47 1.58 1.58 1.57 1.56 1.55 1.54 1.53 1.53 1.52 1.52 1.51 1.51 1.51 1.5012 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51 1.50 1.49 1.49 1.49 1.48 1.4813 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49 1.48 1.47 1.47 1.47 1.46 1.4614 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47 1.46 1.46 1.45 1.45 1.44 1.4415 1.43 1.52 1.52 1.51 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.44 1.43 1.43 1.4316 1.42 1.51 1.51 1.50 1.48 1.47 1.46 1.45 1.44 1.44 1.43 1.43 1.42 1.42 1.4117 1.42 1.51 1.50 1.49 1.47 1.46 1.45 1.44 1.43 1.43 1.42 1.41 1.41 1.41 1.4018 1.41 1.50 1.49 1.48 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40 1.40 1.40 1.3919 1.41 1.49 1.49 1.47 1.46 1.44 1.43 1.42 1.41 1.41 1.40 1.40 1.39 1.39 1.3820 1.40 1.49 1.48 1.47 1.45 1.44 1.43 1.42 1.41 1.40 1.39 1.39 1.38 1.38 1.3722 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39 1.39 1.38 1.37 1.37 1.36 1.3624 1.39 1.47 1.46 1.44 1.43 1.41 1.40 1.39 1.38 1.38 1.37 1.36 1.36 1.35 1.3526 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.37 1.36 1.35 1.35 1.34 1.3428 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.3330 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.33 1.3240 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.31 1.30 1.3050 1.35 1.43 1.41 1.39 1.37 1.36 1.34 1.33 1.32 1.31 1.30 1.30 1.29 1.28 1.2875 1.34 1.41 1.40 1.38 1.36 1.34 1.33 1.31 1.30 1.29 1.28 1.28 1.27 1.26 1.26100 1.34 1.41 1.39 1.37 1.35 1.33 1.32 1.30 1.29 1.28 1.27 1.27 1.26 1.25 1.25∞ 1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27 1.25 1.25 1.24 1.23 1.22 1.22

Tab

el1.

0.75–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.2

5.

89

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 9.52 9.53 9.55 9.57 9.58 9.61 9.63 9.64 9.66 9.67 9.71 9.74 9.78 9.80 9.852 3.41 3.42 3.42 3.42 3.43 3.43 3.43 3.44 3.44 3.44 3.45 3.46 3.46 3.47 3.483 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.46 2.47 2.47 2.47 2.47 2.47 2.474 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.085 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.88 1.87 1.87 1.876 1.76 1.76 1.76 1.76 1.76 1.76 1.75 1.75 1.75 1.75 1.75 1.75 1.74 1.74 1.747 1.68 1.67 1.67 1.67 1.67 1.67 1.67 1.67 1.66 1.66 1.66 1.66 1.65 1.65 1.658 1.62 1.61 1.61 1.61 1.61 1.61 1.60 1.60 1.60 1.60 1.59 1.59 1.59 1.58 1.589 1.57 1.57 1.56 1.56 1.56 1.56 1.56 1.55 1.55 1.55 1.54 1.54 1.54 1.53 1.5310 1.53 1.53 1.53 1.53 1.52 1.52 1.52 1.52 1.51 1.51 1.51 1.50 1.50 1.49 1.4811 1.50 1.50 1.50 1.49 1.49 1.49 1.49 1.48 1.48 1.48 1.47 1.47 1.46 1.46 1.4512 1.48 1.47 1.47 1.47 1.47 1.46 1.46 1.46 1.46 1.45 1.45 1.44 1.44 1.43 1.4213 1.46 1.45 1.45 1.45 1.45 1.44 1.44 1.44 1.43 1.43 1.42 1.42 1.41 1.41 1.4014 1.44 1.44 1.43 1.43 1.43 1.42 1.42 1.42 1.42 1.41 1.41 1.40 1.39 1.39 1.3815 1.42 1.42 1.42 1.41 1.41 1.41 1.41 1.40 1.40 1.40 1.39 1.38 1.38 1.37 1.3616 1.41 1.41 1.40 1.40 1.40 1.39 1.39 1.39 1.39 1.38 1.37 1.37 1.36 1.36 1.3417 1.40 1.39 1.39 1.39 1.39 1.38 1.38 1.38 1.37 1.37 1.36 1.36 1.35 1.34 1.3318 1.39 1.38 1.38 1.38 1.38 1.37 1.37 1.36 1.36 1.36 1.35 1.34 1.34 1.33 1.3219 1.38 1.37 1.37 1.37 1.37 1.36 1.36 1.35 1.35 1.35 1.34 1.33 1.32 1.32 1.3020 1.37 1.37 1.36 1.36 1.36 1.35 1.35 1.35 1.34 1.34 1.33 1.32 1.31 1.31 1.2922 1.36 1.35 1.35 1.35 1.34 1.34 1.33 1.33 1.33 1.32 1.31 1.31 1.30 1.29 1.2824 1.34 1.34 1.34 1.33 1.33 1.33 1.32 1.32 1.31 1.31 1.30 1.29 1.28 1.28 1.2626 1.33 1.33 1.33 1.32 1.32 1.32 1.31 1.31 1.30 1.30 1.29 1.28 1.27 1.27 1.2528 1.32 1.32 1.32 1.31 1.31 1.31 1.30 1.30 1.29 1.29 1.28 1.27 1.26 1.25 1.2430 1.32 1.31 1.31 1.31 1.30 1.30 1.29 1.29 1.29 1.28 1.27 1.26 1.25 1.25 1.2340 1.29 1.29 1.28 1.28 1.28 1.27 1.26 1.26 1.26 1.25 1.24 1.23 1.22 1.21 1.1950 1.27 1.27 1.27 1.26 1.26 1.25 1.25 1.24 1.24 1.23 1.22 1.21 1.20 1.19 1.1675 1.25 1.25 1.24 1.24 1.24 1.23 1.22 1.22 1.21 1.21 1.20 1.18 1.17 1.16 1.13100 1.24 1.24 1.23 1.23 1.23 1.22 1.21 1.21 1.20 1.20 1.18 1.17 1.15 1.14 1.11∞ 1.21 1.21 1.20 1.20 1.19 1.18 1.18 1.17 1.17 1.16 1.14 1.13 1.10 1.09 1.00

Tab

el2.

0.75–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.2

5.

90

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 60.47 60.71 60.90 61.07 61.222 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.423 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.204 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.875 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.246 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.877 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.638 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.469 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.3410 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.2411 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.1712 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.1013 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.0514 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.0115 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.9716 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.9417 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.9118 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.8919 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.8620 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.8422 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 1.88 1.86 1.84 1.83 1.8124 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 1.85 1.83 1.81 1.80 1.7826 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 1.83 1.81 1.79 1.77 1.7628 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.7430 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.7240 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.6650 2.81 2.41 2.20 2.06 1.97 1.90 1.84 1.80 1.76 1.73 1.70 1.68 1.66 1.64 1.6375 2.77 2.37 2.16 2.02 1.93 1.85 1.80 1.75 1.72 1.69 1.66 1.63 1.61 1.60 1.58100 2.76 2.36 2.14 2.00 1.91 1.83 1.78 1.73 1.69 1.66 1.64 1.61 1.59 1.57 1.56∞ 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 1.60 1.57 1.55 1.52 1.50 1.49

Tab

el3.

0.90–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.1

0.

91

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 61.35 61.46 61.57 61.66 61.74 61.88 62.00 62.10 62.19 62.26 62.53 62.69 62.90 63.01 63.332 9.43 9.43 9.44 9.44 9.44 9.45 9.45 9.45 9.46 9.46 9.47 9.47 9.48 9.48 9.493 5.20 5.19 5.19 5.19 5.18 5.18 5.18 5.17 5.17 5.17 5.16 5.15 5.15 5.14 5.134 3.86 3.86 3.85 3.85 3.84 3.84 3.83 3.83 3.82 3.82 3.80 3.80 3.78 3.78 3.765 3.23 3.22 3.22 3.21 3.21 3.20 3.19 3.18 3.18 3.17 3.16 3.15 3.13 3.13 3.106 2.86 2.85 2.85 2.84 2.84 2.83 2.82 2.81 2.81 2.80 2.78 2.77 2.75 2.75 2.727 2.62 2.61 2.61 2.60 2.59 2.58 2.58 2.57 2.56 2.56 2.54 2.52 2.51 2.50 2.478 2.45 2.45 2.44 2.43 2.42 2.41 2.40 2.40 2.39 2.38 2.36 2.35 2.33 2.32 2.299 2.33 2.32 2.31 2.30 2.30 2.29 2.28 2.27 2.26 2.25 2.23 2.22 2.20 2.19 2.1610 2.23 2.22 2.22 2.21 2.20 2.19 2.18 2.17 2.16 2.16 2.13 2.12 2.10 2.09 2.0611 2.16 2.15 2.14 2.13 2.12 2.11 2.10 2.09 2.08 2.08 2.05 2.04 2.02 2.01 1.9712 2.09 2.08 2.08 2.07 2.06 2.05 2.04 2.03 2.02 2.01 1.99 1.97 1.95 1.94 1.9013 2.04 2.03 2.02 2.01 2.01 1.99 1.98 1.97 1.96 1.96 1.93 1.92 1.89 1.88 1.8514 2.00 1.99 1.98 1.97 1.96 1.95 1.94 1.93 1.92 1.91 1.89 1.87 1.85 1.83 1.8015 1.96 1.95 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.87 1.85 1.83 1.80 1.79 1.7616 1.93 1.92 1.91 1.90 1.89 1.88 1.87 1.86 1.85 1.84 1.81 1.79 1.77 1.76 1.7217 1.90 1.89 1.88 1.87 1.86 1.85 1.84 1.83 1.82 1.81 1.78 1.76 1.74 1.73 1.6918 1.87 1.86 1.85 1.84 1.84 1.82 1.81 1.80 1.79 1.78 1.75 1.74 1.71 1.70 1.6619 1.85 1.84 1.83 1.82 1.81 1.80 1.79 1.78 1.77 1.76 1.73 1.71 1.69 1.67 1.6320 1.83 1.82 1.81 1.80 1.79 1.78 1.77 1.76 1.75 1.74 1.71 1.69 1.66 1.65 1.6122 1.80 1.79 1.78 1.77 1.76 1.74 1.73 1.72 1.71 1.70 1.67 1.65 1.63 1.61 1.5724 1.77 1.76 1.75 1.74 1.73 1.71 1.70 1.69 1.68 1.67 1.64 1.62 1.59 1.58 1.5326 1.75 1.73 1.72 1.71 1.71 1.69 1.68 1.67 1.66 1.65 1.61 1.59 1.57 1.55 1.5028 1.73 1.71 1.70 1.69 1.69 1.67 1.66 1.64 1.63 1.63 1.59 1.57 1.54 1.53 1.4830 1.71 1.70 1.69 1.68 1.67 1.65 1.64 1.63 1.62 1.61 1.57 1.55 1.52 1.51 1.4640 1.65 1.64 1.62 1.61 1.61 1.59 1.57 1.56 1.55 1.54 1.51 1.48 1.45 1.43 1.3850 1.61 1.60 1.59 1.58 1.57 1.55 1.54 1.52 1.51 1.50 1.46 1.44 1.41 1.39 1.3375 1.57 1.55 1.54 1.53 1.52 1.50 1.49 1.47 1.46 1.45 1.41 1.38 1.35 1.33 1.25100 1.54 1.53 1.52 1.50 1.49 1.48 1.46 1.45 1.43 1.42 1.38 1.35 1.32 1.29 1.21∞ 1.47 1.46 1.44 1.43 1.42 1.40 1.38 1.37 1.35 1.34 1.30 1.26 1.21 1.18 1.00

Tab

el4.

0.90–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.1

0.

92

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.92 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.433 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.704 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.865 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.626 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.947 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.518 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.229 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.0110 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.8511 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.7212 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.6213 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.5314 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.4615 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.4016 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.3517 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.3118 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.2719 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.2320 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.2022 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.1524 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.15 2.13 2.1126 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.12 2.09 2.0728 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.09 2.06 2.0430 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.0140 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.97 1.95 1.9250 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.99 1.95 1.92 1.89 1.8775 3.97 3.12 2.73 2.49 2.34 2.22 2.13 2.06 2.01 1.96 1.92 1.88 1.85 1.83 1.80100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.89 1.85 1.82 1.79 1.77∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.72 1.69 1.67

Tab

el5.

0.95–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

5.

93

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 246.5 246.9 247.3 247.7 248.0 248.6 249.1 249.5 249.8 250.1 251.1 251.8 252.6 253.0 254.32 19.43 19.44 19.44 19.44 19.45 19.45 19.45 19.46 19.46 19.46 19.47 19.48 19.48 19.49 19.503 8.69 8.68 8.67 8.67 8.66 8.65 8.64 8.63 8.62 8.62 8.59 8.58 8.56 8.55 8.534 5.84 5.83 5.82 5.81 5.80 5.79 5.77 5.76 5.75 5.75 5.72 5.70 5.68 5.66 5.635 4.60 4.59 4.58 4.57 4.56 4.54 4.53 4.52 4.50 4.50 4.46 4.44 4.42 4.41 4.366 3.92 3.91 3.90 3.88 3.87 3.86 3.84 3.83 3.82 3.81 3.77 3.75 3.73 3.71 3.677 3.49 3.48 3.47 3.46 3.44 3.43 3.41 3.40 3.39 3.38 3.34 3.32 3.29 3.27 3.238 3.20 3.19 3.17 3.16 3.15 3.13 3.12 3.10 3.09 3.08 3.04 3.02 2.99 2.97 2.939 2.99 2.97 2.96 2.95 2.94 2.92 2.90 2.89 2.87 2.86 2.83 2.80 2.77 2.76 2.7110 2.83 2.81 2.80 2.79 2.77 2.75 2.74 2.72 2.71 2.70 2.66 2.64 2.60 2.59 2.5411 2.70 2.69 2.67 2.66 2.65 2.63 2.61 2.59 2.58 2.57 2.53 2.51 2.47 2.46 2.4012 2.60 2.58 2.57 2.56 2.54 2.52 2.51 2.49 2.48 2.47 2.43 2.40 2.37 2.35 2.3013 2.51 2.50 2.48 2.47 2.46 2.44 2.42 2.41 2.39 2.38 2.34 2.31 2.28 2.26 2.2114 2.44 2.43 2.41 2.40 2.39 2.37 2.35 2.33 2.32 2.31 2.27 2.24 2.21 2.19 2.1315 2.38 2.37 2.35 2.34 2.33 2.31 2.29 2.27 2.26 2.25 2.20 2.18 2.14 2.12 2.0716 2.33 2.32 2.30 2.29 2.28 2.25 2.24 2.22 2.21 2.19 2.15 2.12 2.09 2.07 2.0117 2.29 2.27 2.26 2.24 2.23 2.21 2.19 2.17 2.16 2.15 2.10 2.08 2.04 2.02 1.9618 2.25 2.23 2.22 2.20 2.19 2.17 2.15 2.13 2.12 2.11 2.06 2.04 2.00 1.98 1.9219 2.21 2.20 2.18 2.17 2.16 2.13 2.11 2.10 2.08 2.07 2.03 2.00 1.96 1.94 1.8820 2.18 2.17 2.15 2.14 2.12 2.10 2.08 2.07 2.05 2.04 1.99 1.97 1.93 1.91 1.8422 2.13 2.11 2.10 2.08 2.07 2.05 2.03 2.01 2.00 1.98 1.94 1.91 1.87 1.85 1.7824 2.09 2.07 2.05 2.04 2.03 2.00 1.98 1.97 1.95 1.94 1.89 1.86 1.82 1.80 1.7326 2.05 2.03 2.02 2.00 1.99 1.97 1.95 1.93 1.91 1.90 1.85 1.82 1.78 1.76 1.6928 2.02 2.00 1.99 1.97 1.96 1.93 1.91 1.90 1.88 1.87 1.82 1.79 1.75 1.73 1.6530 1.99 1.98 1.96 1.95 1.93 1.91 1.89 1.87 1.85 1.84 1.79 1.76 1.72 1.70 1.6240 1.90 1.89 1.87 1.85 1.84 1.81 1.79 1.77 1.76 1.74 1.69 1.66 1.61 1.59 1.5150 1.85 1.83 1.81 1.80 1.78 1.76 1.74 1.72 1.70 1.69 1.63 1.60 1.55 1.52 1.4475 1.78 1.76 1.74 1.73 1.71 1.69 1.66 1.64 1.63 1.61 1.55 1.52 1.47 1.44 1.34100 1.75 1.73 1.71 1.69 1.68 1.65 1.63 1.61 1.59 1.57 1.52 1.48 1.42 1.39 1.28∞ 1.64 1.62 1.60 1.59 1.57 1.54 1.52 1.50 1.48 1.46 1.39 1.35 1.28 1.24 1.00

Tab

el6.

0.95–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

5.

94

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 968.6 973.0 976.7 979.8 982.5 984.92 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.41 39.42 39.43 39.433 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.37 14.34 14.30 14.28 14.254 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.71 8.68 8.665 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.49 6.46 6.436 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.33 5.30 5.277 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.63 4.60 4.578 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.16 4.13 4.109 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.83 3.80 3.7710 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.66 3.62 3.58 3.55 3.5211 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.47 3.43 3.39 3.36 3.3312 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.32 3.28 3.24 3.21 3.1813 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.20 3.15 3.12 3.08 3.0514 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.09 3.05 3.01 2.98 2.9515 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 3.01 2.96 2.92 2.89 2.8616 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.93 2.89 2.85 2.82 2.7917 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.87 2.82 2.79 2.75 2.7218 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.81 2.77 2.73 2.70 2.6719 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.76 2.72 2.68 2.65 2.6220 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.72 2.68 2.64 2.60 2.5722 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.65 2.60 2.56 2.53 2.5024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.59 2.54 2.50 2.47 2.4426 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.54 2.49 2.45 2.42 2.3928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.49 2.45 2.41 2.37 2.3430 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.46 2.41 2.37 2.34 2.3140 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.33 2.29 2.25 2.21 2.1850 5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32 2.26 2.22 2.18 2.14 2.1175 5.23 3.88 3.30 2.96 2.74 2.58 2.46 2.37 2.29 2.22 2.17 2.12 2.08 2.05 2.01100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18 2.12 2.08 2.04 2.00 1.97∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.99 1.94 1.90 1.87 1.83

Tab

el7.

0.975–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

25

.

95

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 986.9 988.7 990.3 991.8 993.1 995.4 997.2 998.8 1000 1001 1006 1008 1011 1013 10182 39.44 39.44 39.44 39.45 39.45 39.45 39.46 39.46 39.46 39.46 39.47 39.48 39.48 39.49 39.503 14.23 14.21 14.20 14.18 14.17 14.14 14.12 14.11 14.09 14.08 14.04 14.01 13.97 13.96 13.904 8.63 8.61 8.59 8.58 8.56 8.53 8.51 8.49 8.48 8.46 8.41 8.38 8.34 8.32 8.265 6.40 6.38 6.36 6.34 6.33 6.30 6.28 6.26 6.24 6.23 6.18 6.14 6.10 6.08 6.026 5.24 5.22 5.20 5.18 5.17 5.14 5.12 5.10 5.08 5.07 5.01 4.98 4.94 4.92 4.857 4.54 4.52 4.50 4.48 4.47 4.44 4.41 4.39 4.38 4.36 4.31 4.28 4.23 4.21 4.148 4.08 4.05 4.03 4.02 4.00 3.97 3.95 3.93 3.91 3.89 3.84 3.81 3.76 3.74 3.679 3.74 3.72 3.70 3.68 3.67 3.64 3.61 3.59 3.58 3.56 3.51 3.47 3.43 3.40 3.3310 3.50 3.47 3.45 3.44 3.42 3.39 3.37 3.34 3.33 3.31 3.26 3.22 3.18 3.15 3.0811 3.30 3.28 3.26 3.24 3.23 3.20 3.17 3.15 3.13 3.12 3.06 3.03 2.98 2.96 2.8812 3.15 3.13 3.11 3.09 3.07 3.04 3.02 3.00 2.98 2.96 2.91 2.87 2.82 2.80 2.7213 3.03 3.00 2.98 2.96 2.95 2.92 2.89 2.87 2.85 2.84 2.78 2.74 2.70 2.67 2.6014 2.92 2.90 2.88 2.86 2.84 2.81 2.79 2.77 2.75 2.73 2.67 2.64 2.59 2.56 2.4915 2.84 2.81 2.79 2.77 2.76 2.73 2.70 2.68 2.66 2.64 2.59 2.55 2.50 2.47 2.4016 2.76 2.74 2.72 2.70 2.68 2.65 2.63 2.60 2.58 2.57 2.51 2.47 2.42 2.40 2.3217 2.70 2.67 2.65 2.63 2.62 2.59 2.56 2.54 2.52 2.50 2.44 2.41 2.35 2.33 2.2518 2.64 2.62 2.60 2.58 2.56 2.53 2.50 2.48 2.46 2.44 2.38 2.35 2.30 2.27 2.1919 2.59 2.57 2.55 2.53 2.51 2.48 2.45 2.43 2.41 2.39 2.33 2.30 2.24 2.22 2.1320 2.55 2.52 2.50 2.48 2.46 2.43 2.41 2.39 2.37 2.35 2.29 2.25 2.20 2.17 2.0922 2.47 2.45 2.43 2.41 2.39 2.36 2.33 2.31 2.29 2.27 2.21 2.17 2.12 2.09 2.0024 2.41 2.39 2.36 2.35 2.33 2.30 2.27 2.25 2.23 2.21 2.15 2.11 2.05 2.02 1.9426 2.36 2.34 2.31 2.29 2.28 2.24 2.22 2.19 2.17 2.16 2.09 2.05 2.00 1.97 1.8828 2.32 2.29 2.27 2.25 2.23 2.20 2.17 2.15 2.13 2.11 2.05 2.01 1.95 1.92 1.8330 2.28 2.26 2.23 2.21 2.20 2.16 2.14 2.11 2.09 2.07 2.01 1.97 1.91 1.88 1.7940 2.15 2.13 2.11 2.09 2.07 2.03 2.01 1.98 1.96 1.94 1.88 1.83 1.77 1.74 1.6450 2.08 2.06 2.03 2.01 1.99 1.96 1.93 1.91 1.89 1.87 1.80 1.75 1.69 1.66 1.5575 1.99 1.96 1.94 1.92 1.90 1.86 1.83 1.81 1.78 1.76 1.69 1.65 1.58 1.54 1.42100 1.94 1.91 1.89 1.87 1.85 1.81 1.78 1.76 1.74 1.71 1.64 1.59 1.52 1.48 1.35∞ 1.80 1.78 1.75 1.73 1.71 1.67 1.64 1.61 1.59 1.57 1.48 1.43 1.34 1.30 1.00

Tab

el8.

0.975–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

25

.

96

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 61572 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 99.433 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.13 27.05 26.98 26.92 26.874 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 14.205 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 9.726 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 7.567 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 6.318 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 5.529 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.9610 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 4.5611 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 4.2512 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 4.0113 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.8214 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.6615 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.5216 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 3.4117 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 3.3118 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 3.2319 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 3.1520 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 3.0922 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.07 3.02 2.9824 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.09 3.03 2.98 2.93 2.8926 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 3.02 2.96 2.90 2.86 2.8128 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.96 2.90 2.84 2.79 2.7530 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.79 2.74 2.7040 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.61 2.56 2.5250 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.63 2.56 2.51 2.46 2.4275 6.99 4.90 4.05 3.58 3.27 3.05 2.89 2.76 2.65 2.57 2.49 2.43 2.38 2.33 2.29100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 2.37 2.31 2.27 2.22∞ 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.25 2.18 2.13 2.08 2.04

Tab

el9.

0.99–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

1.

97

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 6170 6181 6192 6201 6209 6223 6235 6245 6253 6261 6287 6303 6324 6334 63662 99.44 99.44 99.44 99.45 99.45 99.45 99.46 99.46 99.46 99.47 99.47 99.48 99.49 99.49 99.503 26.83 26.79 26.75 26.72 26.69 26.64 26.60 26.56 26.53 26.50 26.41 26.35 26.28 26.24 26.134 14.15 14.11 14.08 14.05 14.02 13.97 13.93 13.89 13.86 13.84 13.75 13.69 13.61 13.58 13.465 9.68 9.64 9.61 9.58 9.55 9.51 9.47 9.43 9.40 9.38 9.29 9.24 9.17 9.13 9.026 7.52 7.48 7.45 7.42 7.40 7.35 7.31 7.28 7.25 7.23 7.14 7.09 7.02 6.99 6.887 6.28 6.24 6.21 6.18 6.16 6.11 6.07 6.04 6.02 5.99 5.91 5.86 5.79 5.75 5.658 5.48 5.44 5.41 5.38 5.36 5.32 5.28 5.25 5.22 5.20 5.12 5.07 5.00 4.96 4.869 4.92 4.89 4.86 4.83 4.81 4.77 4.73 4.70 4.67 4.65 4.57 4.52 4.45 4.41 4.3110 4.52 4.49 4.46 4.43 4.41 4.36 4.33 4.30 4.27 4.25 4.17 4.12 4.05 4.01 3.9111 4.21 4.18 4.15 4.12 4.10 4.06 4.02 3.99 3.96 3.94 3.86 3.81 3.74 3.71 3.6012 3.97 3.94 3.91 3.88 3.86 3.82 3.78 3.75 3.72 3.70 3.62 3.57 3.50 3.47 3.3613 3.78 3.75 3.72 3.69 3.66 3.62 3.59 3.56 3.53 3.51 3.43 3.38 3.31 3.27 3.1714 3.62 3.59 3.56 3.53 3.51 3.46 3.43 3.40 3.37 3.35 3.27 3.22 3.15 3.11 3.0015 3.49 3.45 3.42 3.40 3.37 3.33 3.29 3.26 3.24 3.21 3.13 3.08 3.01 2.98 2.8716 3.37 3.34 3.31 3.28 3.26 3.22 3.18 3.15 3.12 3.10 3.02 2.97 2.90 2.86 2.7517 3.27 3.24 3.21 3.19 3.16 3.12 3.08 3.05 3.03 3.00 2.92 2.87 2.80 2.76 2.6518 3.19 3.16 3.13 3.10 3.08 3.03 3.00 2.97 2.94 2.92 2.84 2.78 2.71 2.68 2.5719 3.12 3.08 3.05 3.03 3.00 2.96 2.92 2.89 2.87 2.84 2.76 2.71 2.64 2.60 2.4920 3.05 3.02 2.99 2.96 2.94 2.90 2.86 2.83 2.80 2.78 2.69 2.64 2.57 2.54 2.4222 2.94 2.91 2.88 2.85 2.83 2.78 2.75 2.72 2.69 2.67 2.58 2.53 2.46 2.42 2.3124 2.85 2.82 2.79 2.76 2.74 2.70 2.66 2.63 2.60 2.58 2.49 2.44 2.37 2.33 2.2126 2.78 2.75 2.72 2.69 2.66 2.62 2.58 2.55 2.53 2.50 2.42 2.36 2.29 2.25 2.1328 2.72 2.68 2.65 2.63 2.60 2.56 2.52 2.49 2.46 2.44 2.35 2.30 2.23 2.19 2.0630 2.66 2.63 2.60 2.57 2.55 2.51 2.47 2.44 2.41 2.39 2.30 2.25 2.17 2.13 2.0140 2.48 2.45 2.42 2.39 2.37 2.33 2.29 2.26 2.23 2.20 2.11 2.06 1.98 1.94 1.8050 2.38 2.35 2.32 2.29 2.27 2.22 2.18 2.15 2.12 2.10 2.01 1.95 1.87 1.82 1.6875 2.25 2.22 2.18 2.16 2.13 2.09 2.05 2.02 1.99 1.96 1.87 1.81 1.72 1.67 1.52100 2.19 2.15 2.12 2.09 2.07 2.02 1.98 1.95 1.92 1.89 1.80 1.74 1.65 1.60 1.43∞ 2.00 1.97 1.93 1.90 1.88 1.83 1.79 1.76 1.72 1.70 1.59 1.52 1.42 1.36 1.00

Tab

el10.

0.99–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

1.

98

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 16211 19999 21615 22500 23056 23437 23715 23925 24091 24224 24334 24426 24505 24572 246302 198.5 199.0 199.2 199.2 199.3 199.3 199.4 199.4 199.4 199.4 199.4 199.4 199.4 199.4 199.43 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.52 43.39 43.27 43.17 43.084 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.82 20.70 20.60 20.51 20.445 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.49 13.38 13.29 13.21 13.156 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.13 10.03 9.95 9.88 9.817 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.27 8.18 8.10 8.03 7.978 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.10 7.01 6.94 6.87 6.819 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.31 6.23 6.15 6.09 6.0310 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.75 5.66 5.59 5.53 5.4711 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42 5.32 5.24 5.16 5.10 5.0512 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.99 4.91 4.84 4.77 4.7213 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.82 4.72 4.64 4.57 4.51 4.4614 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.51 4.43 4.36 4.30 4.2515 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.33 4.25 4.18 4.12 4.0716 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.18 4.10 4.03 3.97 3.9217 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.14 4.05 3.97 3.90 3.84 3.7918 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.94 3.86 3.79 3.73 3.6819 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.93 3.84 3.76 3.70 3.64 3.5920 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.76 3.68 3.61 3.55 3.5022 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.70 3.61 3.54 3.47 3.41 3.3624 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59 3.50 3.42 3.35 3.30 3.2526 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.49 3.40 3.33 3.26 3.20 3.1528 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.41 3.32 3.25 3.18 3.12 3.0730 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 3.25 3.18 3.11 3.06 3.0140 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 3.03 2.95 2.89 2.83 2.7850 8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.99 2.90 2.82 2.76 2.70 2.6575 8.37 5.69 4.63 4.05 3.67 3.41 3.21 3.05 2.93 2.82 2.74 2.66 2.60 2.54 2.49100 8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74 2.66 2.58 2.52 2.46 2.41∞ 7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52 2.43 2.36 2.29 2.24 2.19

Tab

el11.

0.995–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

05

.

99

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 24681 24727 24767 24803 24836 24892 24940 24980 25014 25044 25148 25211 25295 25337 254642 199.4 199.4 199.4 199.4 199.4 199.5 199.5 199.5 199.5 199.5 199.5 199.5 199.5 199.5 199.53 43.01 42.94 42.88 42.83 42.78 42.69 42.62 42.56 42.51 42.47 42.31 42.21 42.09 42.02 41.834 20.37 20.31 20.26 20.21 20.17 20.09 20.03 19.98 19.93 19.89 19.75 19.67 19.55 19.50 19.325 13.09 13.03 12.98 12.94 12.90 12.84 12.78 12.73 12.69 12.66 12.53 12.45 12.35 12.30 12.146 9.76 9.71 9.66 9.62 9.59 9.53 9.47 9.43 9.39 9.36 9.24 9.17 9.07 9.03 8.887 7.91 7.87 7.83 7.79 7.75 7.69 7.64 7.60 7.57 7.53 7.42 7.35 7.26 7.22 7.088 6.76 6.72 6.68 6.64 6.61 6.55 6.50 6.46 6.43 6.40 6.29 6.22 6.13 6.09 5.959 5.98 5.94 5.90 5.86 5.83 5.78 5.73 5.69 5.65 5.62 5.52 5.45 5.37 5.32 5.1910 5.42 5.38 5.34 5.31 5.27 5.22 5.17 5.13 5.10 5.07 4.97 4.90 4.82 4.77 4.6411 5.00 4.96 4.92 4.89 4.86 4.80 4.76 4.72 4.68 4.65 4.55 4.49 4.40 4.36 4.2312 4.67 4.63 4.59 4.56 4.53 4.48 4.43 4.39 4.36 4.33 4.23 4.17 4.08 4.04 3.9013 4.41 4.37 4.33 4.30 4.27 4.22 4.17 4.13 4.10 4.07 3.97 3.91 3.82 3.78 3.6514 4.20 4.16 4.12 4.09 4.06 4.01 3.96 3.92 3.89 3.86 3.76 3.70 3.61 3.57 3.4415 4.02 3.98 3.95 3.91 3.88 3.83 3.79 3.75 3.72 3.69 3.58 3.52 3.44 3.39 3.2616 3.87 3.83 3.80 3.76 3.73 3.68 3.64 3.60 3.57 3.54 3.44 3.37 3.29 3.25 3.1117 3.75 3.71 3.67 3.64 3.61 3.56 3.51 3.47 3.44 3.41 3.31 3.25 3.16 3.12 2.9818 3.64 3.60 3.56 3.53 3.50 3.45 3.40 3.36 3.33 3.30 3.20 3.14 3.05 3.01 2.8719 3.54 3.50 3.46 3.43 3.40 3.35 3.31 3.27 3.24 3.21 3.11 3.04 2.96 2.91 2.7820 3.46 3.42 3.38 3.35 3.32 3.27 3.22 3.18 3.15 3.12 3.02 2.96 2.87 2.83 2.6922 3.31 3.27 3.24 3.21 3.18 3.12 3.08 3.04 3.01 2.98 2.88 2.82 2.73 2.69 2.5524 3.20 3.16 3.12 3.09 3.06 3.01 2.97 2.93 2.90 2.87 2.77 2.70 2.61 2.57 2.4326 3.11 3.07 3.03 3.00 2.97 2.92 2.87 2.84 2.80 2.77 2.67 2.61 2.52 2.47 2.3328 3.03 2.99 2.95 2.92 2.89 2.84 2.79 2.76 2.72 2.69 2.59 2.53 2.44 2.39 2.2530 2.96 2.92 2.89 2.85 2.82 2.77 2.73 2.69 2.66 2.63 2.52 2.46 2.37 2.32 2.1840 2.74 2.70 2.66 2.63 2.60 2.55 2.50 2.46 2.43 2.40 2.30 2.23 2.14 2.09 1.9350 2.61 2.57 2.53 2.50 2.47 2.42 2.37 2.33 2.30 2.27 2.16 2.10 2.00 1.95 1.7975 2.45 2.41 2.37 2.34 2.31 2.25 2.21 2.17 2.14 2.10 1.99 1.92 1.82 1.77 1.59100 2.37 2.33 2.29 2.26 2.23 2.17 2.13 2.09 2.05 2.02 1.91 1.84 1.74 1.68 1.49∞ 2.14 2.10 2.06 2.03 2.00 1.95 1.90 1.86 1.82 1.79 1.67 1.59 1.47 1.40 1.00

Tab

el12.

0.995–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

05

.

100

m | n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 Alle > 400 000 (fra 405 000 til 616 000)2 998.5 999.0 999.2 999.2 999.3 999.3 999.4 999.4 999.4 999.4 999.4 999.4 999.4 999.4 999.43 167.0 148.5 141.1 137.1 134.6 132.8 131.6 130.6 129.9 129.2 128.7 128.3 128.0 127.6 127.44 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 48.47 48.05 47.70 47.41 47.16 46.95 46.765 47.18 37.12 33.20 31.09 29.75 28.83 28.16 27.65 27.24 26.92 26.65 26.42 26.22 26.06 25.916 35.51 27.00 23.70 21.92 20.80 20.03 19.46 19.03 18.69 18.41 18.18 17.99 17.82 17.68 17.567 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 14.33 14.08 13.88 13.71 13.56 13.43 13.328 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.77 11.54 11.35 11.19 11.06 10.94 10.849 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 9.72 9.57 9.44 9.33 9.2410 21.04 14.91 12.55 11.28 10.48 9.93 9.52 9.20 8.96 8.75 8.59 8.45 8.32 8.22 8.1311 19.69 13.81 11.56 10.35 9.58 9.05 8.66 8.35 8.12 7.92 7.76 7.63 7.51 7.41 7.3212 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 7.14 7.00 6.89 6.79 6.7113 17.82 12.31 10.21 9.07 8.35 7.86 7.49 7.21 6.98 6.80 6.65 6.52 6.41 6.31 6.2314 17.14 11.78 9.73 8.62 7.92 7.44 7.08 6.80 6.58 6.40 6.26 6.13 6.02 5.93 5.8515 16.59 11.34 9.34 8.25 7.57 7.09 6.74 6.47 6.26 6.08 5.94 5.81 5.71 5.62 5.5416 16.12 10.97 9.01 7.94 7.27 6.80 6.46 6.19 5.98 5.81 5.67 5.55 5.44 5.35 5.2717 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75 5.58 5.44 5.32 5.22 5.13 5.0518 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 5.25 5.13 5.03 4.94 4.8719 15.08 10.16 8.28 7.27 6.62 6.18 5.85 5.59 5.39 5.22 5.08 4.97 4.87 4.78 4.7020 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.94 4.82 4.72 4.64 4.5622 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99 4.83 4.70 4.58 4.49 4.40 4.3324 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80 4.64 4.51 4.39 4.30 4.21 4.1426 13.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64 4.48 4.35 4.24 4.14 4.06 3.9928 13.50 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50 4.35 4.22 4.11 4.01 3.93 3.8630 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 4.11 4.00 3.91 3.82 3.7540 12.61 8.25 6.59 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.75 3.64 3.55 3.47 3.4050 12.22 7.96 6.34 5.46 4.90 4.51 4.22 4.00 3.82 3.67 3.55 3.44 3.35 3.27 3.2075 11.73 7.58 6.01 5.16 4.62 4.24 3.96 3.74 3.56 3.42 3.30 3.19 3.10 3.03 2.96100 11.50 7.41 5.86 5.02 4.48 4.11 3.83 3.61 3.44 3.30 3.18 3.07 2.99 2.91 2.84∞ 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.84 2.74 2.66 2.58 2.51

Tab

el13.

0.999–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

01

.

101

m | n 16 17 18 19 20 22 24 26 28 30 40 50 75 100 ∞1 Alle > 600 000 (fra 617 000 til 637 000)2 999.4 999.4 999.4 999.4 999.4 999.5 999.5 999.5 999.5 999.5 999.5 999.5 999.5 999.5 999.53 127.1 126.9 126.7 126.6 126.4 126.2 125.9 125.7 125.6 125.4 125.0 124.7 124.3 124.1 123.54 46.60 46.45 46.32 46.21 46.10 45.92 45.77 45.64 45.53 45.43 45.09 44.88 44.61 44.47 44.055 25.78 25.67 25.57 25.48 25.39 25.25 25.13 25.03 24.94 24.87 24.60 24.44 24.22 24.12 23.796 17.45 17.35 17.27 17.19 17.12 17.00 16.90 16.81 16.74 16.67 16.44 16.31 16.12 16.03 15.757 13.23 13.14 13.06 12.99 12.93 12.82 12.73 12.65 12.59 12.53 12.33 12.20 12.04 11.95 11.708 10.75 10.67 10.60 10.54 10.48 10.38 10.30 10.22 10.16 10.11 9.92 9.80 9.65 9.57 9.339 9.15 9.08 9.01 8.95 8.90 8.80 8.72 8.66 8.60 8.55 8.37 8.26 8.11 8.04 7.8110 8.05 7.98 7.91 7.86 7.80 7.71 7.64 7.57 7.52 7.47 7.30 7.19 7.05 6.98 6.7611 7.24 7.17 7.11 7.06 7.01 6.92 6.85 6.78 6.73 6.68 6.52 6.42 6.28 6.21 6.0012 6.63 6.57 6.51 6.45 6.40 6.32 6.25 6.19 6.14 6.09 5.93 5.83 5.70 5.63 5.4213 6.16 6.09 6.03 5.98 5.93 5.85 5.78 5.72 5.67 5.63 5.47 5.37 5.24 5.17 4.9714 5.78 5.71 5.66 5.60 5.56 5.48 5.41 5.35 5.30 5.25 5.10 5.00 4.87 4.81 4.6015 5.46 5.40 5.35 5.29 5.25 5.17 5.10 5.04 4.99 4.95 4.80 4.70 4.57 4.51 4.3116 5.20 5.14 5.09 5.04 4.99 4.91 4.85 4.79 4.74 4.70 4.54 4.45 4.32 4.26 4.0617 4.99 4.92 4.87 4.82 4.78 4.70 4.63 4.57 4.53 4.48 4.33 4.24 4.11 4.05 3.8518 4.80 4.74 4.68 4.63 4.59 4.51 4.45 4.39 4.34 4.30 4.15 4.06 3.93 3.87 3.6719 4.64 4.58 4.52 4.47 4.43 4.35 4.29 4.23 4.18 4.14 3.99 3.90 3.78 3.71 3.5120 4.49 4.44 4.38 4.33 4.29 4.21 4.15 4.09 4.05 4.00 3.86 3.77 3.64 3.58 3.3822 4.26 4.20 4.15 4.10 4.06 3.98 3.92 3.86 3.82 3.78 3.63 3.54 3.41 3.35 3.1524 4.07 4.02 3.96 3.92 3.87 3.80 3.74 3.68 3.63 3.59 3.45 3.36 3.23 3.17 2.9726 3.92 3.86 3.81 3.77 3.72 3.65 3.59 3.53 3.49 3.44 3.30 3.21 3.08 3.02 2.8228 3.80 3.74 3.69 3.64 3.60 3.52 3.46 3.41 3.36 3.32 3.18 3.09 2.96 2.90 2.6930 3.69 3.63 3.58 3.53 3.49 3.42 3.36 3.30 3.26 3.22 3.07 2.98 2.86 2.79 2.5940 3.34 3.28 3.23 3.19 3.14 3.07 3.01 2.96 2.91 2.87 2.73 2.64 2.51 2.44 2.2350 3.14 3.09 3.04 2.99 2.95 2.88 2.82 2.76 2.72 2.68 2.53 2.44 2.31 2.25 2.0375 2.90 2.84 2.79 2.75 2.71 2.64 2.57 2.52 2.48 2.44 2.29 2.19 2.06 1.99 1.75100 2.78 2.73 2.68 2.63 2.59 2.52 2.46 2.41 2.36 2.32 2.17 2.08 1.94 1.87 1.62∞ 2.45 2.40 2.35 2.31 2.27 2.19 2.13 2.08 2.03 1.99 1.84 1.73 1.58 1.49 1.00

Tab

el14.

0.999–

Frak

tileriF

(n,m

)–fordelin

gen=

F0.0

01

.

102

6 Rettede kurveblade til ”Miller & Freund” p 585

−0.5 0 0.5 1 1.5 2 2.5 30

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

2

3

45

67

810

1520

304050

75100

−0.5 0 0.5 1 1.5 2 2.5 30

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

2

3

4

56

78

10

15

2030

4050

75100

Figurerne side 585 (5. udg. 596): OC-kurver for ensidede tests for middelværdi inormalfordelingen baseret pa kendt varians. Øverst kurver svarende til α = 5% og denederste α = 1%.

103

−0.5 0 0.5 1 1.5 2 2.5 30

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

2

3

45

6

810

1520

3040

5075

100

−0.5 0 0.5 1 1.5 2 2.5 30

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

2

3

4

5

6

8

10

15

20

3040

50

75100

Figurerne side 586 (5. udg. 597): OC-kurver for tosidede tests for middelværdi inormalfordelingen baseret pa kendt varians. Øverst kurver svarende til α = 5% og denederste α = 1%. Som figuren antyder, er de alle symmetriske omkring 0.

104

7 Engelsk-dansk ordliste jfr. bogens indeksregister

Absolute variation Numerisk variation (uden fortegn)Acceptable Quality Level (AQL) Tilfredsstillende kvalitetsniveauAcceptance number Godkendelses talAdditive set function Additiv mængde funktionAdjusted treatment sum of squares Korrigeret kvadrat(afvigelses)sumAliasing Aliasing (uadskillelighed for estimater af effekter)Analysis of covariance Kovarians analyse (ANOVA med kovariat)Analysis of variance (ANOVA) Variansanalyse (ANOVA)

interblock mellem blokkeintrablock indenfor blokke

ANOVA (Analysis of variance) Variansanalyse (ANOVA)Arithmetic mean Aritmetrisk gennemsnitAssignable variation (cause) Tilknyttet variation (arsag)Average outgoing quality Gennemsnitlig udgaende kvalitet

limit grænseAverage sample number Gennemsnit stikprøvestørrelse(The) Axioms of probability Sandsynlighedsregningens grundsætningerBalanced design Balanceret forsøgsplan

incomplete block ufuldstændig blokBar chart Pinde diagramBayes’ theorem Bayes’ theoremBernoulli trials Bernoulli forsøgBeta distribution Beta fordelingBetween-samples sum of squares Kvadrat(afvigelses)sum mellem prøverBetween-samples mean square Middelkvadrat(afvigelses)sum mellem prøverBinomial coefficient Binomial koefficientBinomial distribution BinomialfordelingBivariate normal distribution Todimensional normalfordelingBlock BlokBlock sum of squares Kvadrat(afvigelses)sum for blokkeBoxplot BoxplotCategorical distribution Kategorisk fordeling

fordeling pa alternative kategorierCausality ArsagssammenhængCause-and-effect diagram Arsags-virknings diagramc-chart c-kort (Poisson fordelings kontrol kort)Censored lifetimes Censorerede levetiderCentral limit theorem Centrale grænseværdi sætningCentral line Central linie (midt linie i kontrol kort)Chebychev’s theorem Chebychev’s theoremChi-square (χ2−) distribution χ2-fordeling (udtales chi-i-anden fordeling)

105

Chi-square (χ2−) test χ2-test (udtales chi-i-anden test)Circular normal distribution Circulær normal fordelingClass Klasse

boundary grænsefrequency hyppighedinterval intervallimit grænsemark mærke

Coefficent of variation VariationskoefficientColumn Sum of squares Søjle kvadrat(afvigelses)sumComplete factorial Fuldstændigt faktor forsøgCompletely randomized design Fuldstændig randomiseret forsøgComposite hypothesis Sammensat hypoteseConcommitant variable Samvarierende variabelConditional probability Betinget sandsynlighed(s)

density -tætheddistribution -fordeling

Confidence Konfidensdegree of -gradinterval -intervallimit -grænse

Confounding Konfundering (sammenblanding)Consistency to probabilities Konsistens med 3. sandsynlighedsaxiomConsumers risk Aftagers (købers) risikoContingency table KontingenstabelContinuity correction KontinuitetskorrektionContinuous random variable Kontinuert (modsat diskret) stokastisk var.Control chart Kontrol kort

for attributes for attributter (diskret variabel)for fraction defectives for andel defekte (emner)for means for gennemsnitfor measurements for (kontinuert) malingfor fraction defectives for andel defektefor number of defects for antal fejlfor ranges for variationsbredderfor standard deviations for standardafvigelser

Control limits KontrolgrænserCorrection factor KorrektionsfaktorCorrection term (in ANOVA) Korrektionsled (i ANOVA)Correlation Korrelation

analysis -sanalysecoefficient, population -skoefficient (populations-)coefficient, sample -skoefficient (stikprøve-)

Covariance (analysis of) Kovarians (-analyse)

106

Critical region (for ...) Kritisk omrade (for ...)Critical values Kritiske værdierCumulative distribution Kumulativ fordeling (sumfordeling)Cumulative probability Kumulativ sandsynlighedCurvilnear regression Kurvelineær regression (-sanalyse)Cusum (chart) Kumulativ sum (kontrolkort)Defect (en) FejlDefective Fejlbehæftet (emne)Defining contrast Definerende kontrastDegree of confidence KonfidensgradDegrees of freedom FrihedsgraderDensity Tæthed (-sfordeling)

joint fælles (gældende for flere)marginal marginal (gældende for een)

Density histogram TæthedshistogramDeviation from mean Afvigelse fra gennemsnitDiscrete Diskret (modsat kontinuert)

random variable stokastisk variabelsample space udfaldsrum (heltallene f.eks.)

Discrete uniform distribution LigefordelingenDistribution FordelingDistribution function FordelingsfunktionDot diagram PrikdiagramDouble sampling Dobbelt stikprøvetagning (to-trins-prøvning)Double stem display Dobbel stamme-og-blad diagramDummy analysis of variance table Kunstig variabel ANOVA tabelEffect EffektEffect total Effekt total (sum)Empirical cumulative distribution Empirisk fordelingsfunktionEmpty set Tom mængdeEndpoint convention Konvention for klassegrænse (for histogram)Error Afvigelse (evt. ’fejl’ i mening ’afvigelse’)

interblock mellem blokkeintrablock indenfor blokkesum of squares of ... , SSE kvadrat(afvigelses)sum for ... , SAKrest

Error type I and II (in testing) Type I og II fejl (ved testning)Estimated standard error Estimeret (empirisk) standard afvigelse

eller stikprøvespredningEstimation, efficient Estimation med mindst mulig variansEstimation, interval Interval estimation (konfidensinterval)Estimation, point Punkt estimat (f.eks. µ eller σ2)Events Hændelser

independent uafhængigemutually exclusive gensidigt udelukkende (hinanden)

Expectation Forventning (-sværdi)

107

Expected cell frequence Forventet hyppighed i cellerExperimental design ForsøgsplanlægningExplorative data analysis Explorativ data analyseExponential distribution Eksponential fordelingExponential form Exponential form (modsat logaritmisk)Exponential regression Eksponentiel regression (-sanalyse)F-distribution F-fordelingF-test F-testFactorial experiment Faktorforsøg (en art forsøgsplan)

complete fuldstændigtFactorial notation Faktor notationFactor Faktor (en variabel, som pavirker responset)Failure rate Fejl rate

function (fordelings-) funktioninstantaneous øjeblikkelig

Failure-time distribution Tid-til-fejl fordelingFinite distribution Fordeling for endelig population

correction factor for korrektionsfaktor forFinite sample space Endeligt udfaldsrumFive-stem display Stamme-og-blad diagram med 5 stammerFractional replication Ikke fuldstændig gentagelse (af forsøgsplan)Frequency distribution Frekvens- (eller hyppigheds-) fordelingGeneralized addition rule Generaliseret additionsregelGeometric distriution Geometrisk fordelingGoodness-of-fit test Test for modeltilpasningGraeco-Latin square Græsk-Romersk kvadratGrand mean Gennemsnit for alle dataGrouped data Grupperede dataH-test H-testHalf normal plot Ensidet normalplot

(normal plot for numeriske afvigelser)Half-replicate Halv gennemførelse af fuldstændig forsøgsplanHat notation Hat notation (f.eks. er µ estimat for µ)Histogram HistogramHypothesis Hypotese

alternative alternativcomposite sammensat (i modsætning til simpel)null nul (H0)simple simpel (i modsætning til sammensat)

Incomplete-block design Ufuldstændigt blokforsøgIndependence UafhængighedIndependent events Uafhængige hændelserInference, statistical Statistisk inferens (følgeslutninger baseret pa data)

108

Infinite population Uendelig populationInteraction Vekselvirkning (i flerfaktor ANOVA)Interblock analysis of variance ANOVA for variation mellem blokkeInterblock error Variation mellem blokkeInterquartile range Afstand mellem kvartiler (1. og 3.)Intersection (of sets) Intersection of mængderInterval estimate Interval estimat (konfidensinterval)Intrablock analysis of variance ANOVA indenfor blokkeIntrablock error Variation indenfor blokkeJoint ... Fælles ...Kurtosis Kurtosis (relateret to 4. moment i fordeling)Latin-square(s), orthogonal Romersk(e) kvadrat(er), ortogonaleLaw of large numbers Store tals lovLeaf Blad (i stem-and-leaf plot)Least significant range Mindste signifikante variationsbreddeLeast squares method Mindste kvadraters metodeLevel of factor Faktors niveauLevel of significance SignifikansniveauLife testing Levetids testLikelihood Likelihood (sandsynlighedsteoretisk begreb)Limits of prediction PrædiktionsgrænseLinear regression Lineær regressionsanalyseLocation BeliggenhedLogarithmic form Logaritmisk form (modsat eksponentiel)Log-normal distribution Lognormal fordelingLot tolerance percent defective (LTPD) Grænse (øvre) for andel defekte i et partiLurking variable Skjult betydende variabel (som evt. overses)Main effect HovedeffektMarginal density Marginal tæthedsfunktionMarginal distribution function Marginal fordelingsfunktionMatched pairs t-test Parret t-testMathematical expectation Matematisk forventningsværdi (µ f.eks.)Maximum likelihood estimator Estimator baseret pa maximum likelihood metodenMean Gennemsnit (af data) eller matematisk

middelværdi for stokastisk variabelMean arrival rate Middel ankomst rateMean square Middel kvadratafvigelse (oftest en s2 værdi)

between-sample mellem prøverwithin-sample indefor prøver

Median MedianMode Modus (højeste punkt pa tæthedsfunktion)Moments Momenter (omkring middelværdi)Monte Carlo Monte Carlo (simulation med tilfældige tal)

109

Multifactor experiment Mange-faktor-eksperimentMultinomial distribution Multinomial fordelingMultiple comparisond Multiple sammenligningerMultiple correlation Multipel korrelationMultiple regression Multipel regression (-sanalyse)Multiple sampling plan Multipel stikprøve planMultiplication of choices Multiplikation af valgmulighederMutually exclusive Gensidigt udelukkende (hinanden)Negatively-skewed distribution Negativt skæv fordelingNeyman-Pearson theory En samling statistiske teorierNonparametric tests Ikke-parametriske testsNonreplacement test Prøvetagning uden tilbagelægningNormal distribution NormalfordelingNormal equations NormalligningerNormal probability density Normal(fordelings) tæthedNormal scores Normal scoresNormal scores plot Normalplot eller fraktildiagramNull hypothesis Nul hypotese (H0)Numerical distribution Numerisk (værdi) fordelingObserved cell frequency Observeret celle hyppighedOdd-Even rule Lige-ulige regelOdds OddsOgive Empirisk fordelingsfunktion (S-formet funktion)One-sample t-test Enkelt stikprøve t-test

One-sided alternative Ensidet alternativ

One-sided test Ensidet test

One-sided tolerance bound Ensidet tolerancegrænseOne-tailed test Test baseret pa en hale i fordeling

One-way classification En-vejs klassifikation (I ANOVA)Operating characteristic curve (OC) Operationskarakteristisk kurveOrthogonal Latin squares Ortogonale romerske kvadraterOutcome (of experiment) Udfald (af et forsøg)Outlier Outlier (mistænkeligt meget afvigende observation)p-chart p-kort (i binomialfrdelingen)P-value P-værdi (for faktisk udfald af en teststørrelse)Paired-sample t-test Parret t-testPairing Sætte (malinger) sammen i parParallel system Parallelt systemParameter ParameterPareto diagram Pareto diagramPercentage distribution Procentvis fordelingPercentiles Procent-angivende værdier (for fordeling)

110

Permutation PermutationPictogram PictogramPie chart LagkagediagramPoint estimation Punktestimation (modsat intervalestimation)Poisson process Poisson processPolynomial regression Polynomial regression (-sanalyse)Pooling SammenvejningPopulation PopulationPositively-skewedPositivt skæv fordelingPower function Styrkefunktion (for et test)Prediction, limits of Prædiktion (-sgrænser)Probable error of the mean Sandsynlig fejl for middelværdiestimatProcess capability index Proces kapabilitetsindeksProducer’s risk Producentens (eller leverandørens) risikoPrportions AndeleQuality assurance KvalitetssikringQuality improvement KvalitetsforbedringQuarter-replicate Kvart gennemførelse af fuldstændig forsøgsplanQuartile KvartilRandom Tilfældigt varierendeRandom digits Tilfældige tal (i reglen fra en computerRandomization RandomiseringRandomized-block design Randomiseret blokforsøg (en forsøgsplan)Random variable Stokastisk variableRange VariationsbreddeRank-correlation cefficient RangkorrelationskoefficientRank sum RangsumRaw data Ra (ubehandlede) dataR-chart R-kort (Variationsbredde kort)Reciprocal function Omvendt funktionRejection number AfvisningstalRelative variation Relativ variationReliability PalidelighedRepeated trials Gentagne malingerReplacement test Palideligheds test med erstatningReplication GentagelseResidual Restvariation (ikke-forklaret variation)Residual sum of squares Residual (eller rest-) kvadratafvigelsessumResponse-surface analysis Responsflade analyseRobustness RobusthedRule of elimination EliminationsregelRuns Runs

111

Sample StikprøveSample correlation coefficient Empirisk korrelationskoefficientSample proportion Empirisk andelSample, random Tilfældigt udtaget stikprøveSample range Variationsbredde for stikprøveSample variance Empirisk varians, stikprøvevariansSample mean Empirisk middelværdi, stikprøvegennemsnitSample size StikprøvestørrelseSampling PrøvetagningSample space Ufaldsrum (de mulige værdier for stokastisk var.)

continuous kontinuert (normalfordelingen f.eks.)discrete diskret (binomial- og Poissonfordelingen f.eks.)finite endeligt (binomialfordelingen f.eks.)infinite uendeligt (Poissonfordelingen f.eks.)acceptance godkendelses- (kontrol vha. stikprøver)distribution fordeling for stikprøveværdi (t-, F og χ2-ford.)double dobbeltmultiple multipel (flertrins-)sequential sekventiel (en af gangen f.eks.)single enkelt (hele stikprøven pa en gang)with/without replacement med/uden tilbagelægning

Sampling distribution Stikprøvefordelingof the mean for gennemsnittetof the variance for variansen

Scatter plot Plot for samhørende værdier (for to variable)Series system Serielt system (indenfor palidelighedsteori)Set, empty Mængde, tomSet function Funktion, som virker pa alle elementer i en mængdeσ-chart σ-kontrolkortSignificance level SignifikansniveauSigns, table of FortegnstabelSign test Fortegnstest (i binomialfordelingen)Simple hypothesis Simpel hypotese (modsat sammensat hypotese)Simulation Simulation (i reglen numerisk med computer)Single sampling EnkeltprøvningSkewness, positive/negative Skævhed (af fordeling), positiv/negativSlope (of regression line) Hældningskoefficient (for reressionslinie)Smith-Sattertwaite test Smith-Sattertwaite testSpecial addition rule Særlig additionsregelSpecial product rule Særlig multiplikationsregelSS(.), SSE, SST etc. SAK (kvadratafvigelsessum for diverse størrelser)Standard deviation Standard afvigelse

of a probability density (σ) for sandsynlighedstæthed (σ)of a sample distribution (s) for stikprøvetæthed (s)of a sample (s) for en stikprøve (s)

112

Standarderror of estimate Standardafvigelse for et estimat (f.eks. sX)Standarderror of the mean Standardafvigelse for gennemsnittet = sX

Standardized mean Standardiseret gennemsnitStandardized random variable Standardiseret stokastisk variabel: (X − µ)/σStandard normal distribution Standardiseret normalfordeling (∼ N(0, 1))Standard order Standard rækkefølgeStatistic Stikprøvefunktion, f.eks. X, s, F = s2

1/s22

Statistical control Statistisk kontrolStatistical inference Statistisk inferens (følgeslutninger baseret pa data)Stem Stamme (i Stem-and-leaf plot)Stem-and-leaf display Stamme-og-blad plotStem label Benævnelse for stamme (i Stem-and-leaf plot)Stochastically larger/smaller than Stokastisk større/mindre endStudent’s t-distribution (Students) t-fordelingSubjective probability Subjektiv (forhandsantaget) sandsynlighedSum of products Sum af produkter (f.eks.

∑xiyi)

Sum of squares of deviations Kvadrat(afvigelses)sum (SAK)Sum of squares Kvadrat(afvigelses)sum (f.eks. SAK=

∑(xi − x)2)

between samples mellem stikprøverfor blocks for blokkefor columns for søjlerfor error for afvigelser, fejlfor interaction for vekselvirkningfor replication for gentagelser (af forsøgsrunder, f.eks.)for residual for residual, restvariationfor rows for rækkertotal for total sum (af alle data)for treatments for behandlingerfor treatments, adjusted for behandlinger, korrigeret

Symmetrical distribution Symmetrisk fordeling (normalfordelingen f.eks.)Table of signs FortegnstabelTail probability (right/left) Halesandsynlighed (højre/venstre)t-distribution (Students) t-fordelingTest of (a) hypothesis Test af (en) hypoteseThree factor experiment Faktorforsøg med tre faktorerThree-sigma limits 3-σ-grænser (i kvalitetskontrol)Tolerance bound Tolerance nedre grænseTolerance limits Tolerance grænserTotal number of runs Totalt antal runs (i run test)Total probability, rule of Total sandsynlighed, regel omTotal sum of squares Total kvadrat(afvigelses)sumTotal time (in test plot) Totalt tidsforbrug (i test plot)Transformation Transformation (f.eks. Y = log(X))

113

Treatment sum of squares Kvadrat(afvigelses)sum for behandlingerTree diagram træ-diagramTruncated test Trunkeret testt-test t-testTwo-factor experiment Faktorforsøg med to faktorer2n factorial experiment 2n faktor forsøgTwo-sample t-test To-stikprøve t-test (ikke parret t-test)Two-sided alternative Tosidet alternativ (i test)Two-sided test Tosidet test (test med tosidet alternativ)Two-way classification Klassifikation efter to kriterierType I and type II error Type I og type II fejl(-tagelse) (i test)Unbiased estimator Central estimator (forventningstro estimator)Uniform distribution Uniform (rektangulær) fordelingUnion Union ∼ foreningsmæmgdeUnit Enhed(-s)Unreliablities, product rule for Produktregel for ikke-palidelighederU -test U -test (i rang test)Variance Varians

analysis of, (ANOVA) -analyse (ANOVA)of probability density (σ2) af sandsynlighedsfordeling (σ2)sample, (s2) empirisk varians, stikprøvevarians, (s2)sampling distribution of, fordeling af s2 (∼ χ2/f -fordeling)

Variation Variationcoefficient of, -skoefficientrelative relativ

Venn diagram Venn diagram (i mængdelæren)Waiting time Ventetid (jfr. exponentialfordelingen, f.eks.)Weibull distribution Weibull fordelingWeibull plot Wiebull plotWeigted mean Vægtet gennemsnitWithin-sample mean square s2 indenfor stikprøverWilcoxon test Wilcoxon (ikke parametrisk) testx-chart (udtales x-bar-chart) x-kort (udtales x-streg-kort)Yates’ method Yates’ metode (en variansanalysemetode)Z-transformation Z-transformation

114

8 Symbolliste til ”Miller & Freund” 7. (og 6.)

udgave

Listen dækker pensum for F22-1 og er ikke fuldstændig for bogen.De anførte sidetal henviser til 7. udgave og (6. udgave)

Symbol Side Betydninga 340 (332) Empirisk afskæring i regressionslinie (α = a)

b 340 (332) Empirisk hældning i regressionslinie (β = b)b(x; n, p) 107 (103) Binomial frekvensfunktionB(x; n, p) 107 (104) Binomial fordelingsfunktiond 255 (251) Specificeret normeret forskel pa middelværdiereij 301 (293 Beregnet (skønnet) antal i ’celle’ i, jE 229 (224 Maximum fejl (for estimat)E(X) 183 (180) Forventningsværdi (E(X) = µ)fi 39 (38) Hyppighed af observationer i klasse i histogramf(x) 103 (101) Frekvensfunktion, tæthedsfunktion for stokastisk variabel XF (x) 104 (102) Fordelingsfunktion for stokastisk variabel X, F (x) = PX ≤ xF (ν1, ν2) 220 (216) F -fordelingen med ν1 og ν2 frihedsgraderh(x; n, a, N) 110 (107) Hypergeometrisk frekvensfunktionL(µ) 252 (248) OC funktion for test (sandsynlighed for at test leder til accept)LN(α, β2) 166 (163) Log-normalfordeling med parametre α og β2

n (Som regel) størrelse af stikprøveN(µ, σ2) 153 (150) Normalfordeling med middelværdi og varians µ og σ2

oij 301 (293) Observeret antal i ’celle’ i, jp 107 (103) Sandsynlighedsparameter i binomialfordelingenp Estimat for pP (udsagn) ”Sandsynligheden for(udsagn)”Q1, Q2, Q3 34 (33) 1. 2. og 3. kvartiler i (empirisk) fordelingR 282 (275) Range (variationsbredde) for observationer i stikprøve (x(n) − x(1))s2

e 343 (336) Residual standardafvigelses2 31 (30) (Empirisk) varianss 32 (31) (Empirisk) standardafvigelse (eller spredning)Sxx 340 (333) Kvadratafvigelsessum for x’er i stikprøveSyy 340 (333) Kvadratafvigelsessum for y’er i stikprøveSxy 340 (333) Produktafvigelsessum for x’er og y’er i stikprøveSS(Tr) 407 (397) Kvadratafvigelsessum mellem behandlinger (i variansanalyse)SSE 407 397) Kvadratafvigelsessum indenfor behandlinger (i variansanalyse)SST 407 397) Total kvadratafvigelsessum (SST = SS(Tr) + SSE) (i variansanalyse)SS(Bl) 419 (409) Kvadratafvigelsessum (i blokforsøg variansanalyse)t 216 (213) t-fordelingentp 217 (213) (1 − p)-fraktil i t-fordelingenT 131 (127) Tidsinterval af længde TV 33 (31) (Empirisk) variationskoefficientV ar(X) 183 (180) Varians (V ar(X) = σ2)

115

Symbol Side Betydningx Udfald af stokastisk variabel (X) eller en regressionsvariabelx(i) i’te mindste observation (x(1) er mindste og x(n) største observation)X Stokastisk variabelx 29 (28) Gennemsnit, empirisk middelværdix0 348 (343) Specificeret værdi for x (regressionsvariabel)y Udfald af stokastisk variabel, YY Stokastisk variabelzp 156 (153) Standard normal fraktil (PZ ≥ zp = p)Z 157 (153) Standardiseret normalt fordelt variabel (Z ∈ N(0, 1))α Teoretisk konstant (benyttes ofte som ”teoretisk” værdi)α 241 (235) Signifikansniveau = Sandsynlighed for ”Type I” fejl i testα 345 (331) Afskæring i regressionslinie (Y = α + βx + ε)αi 405 (395) Effekt fra behandling i (i variansanalysemodel)(αβ)ij 451 (439) Vekselvirkning i to-faktorforsøgβ 241 (235) Sandsynlighed for ”Type II” fejl i testβ 345 (331) Hældningskoefficient i regressionslinie (Y = α + βx + ε)β1, β2, . . . 418 (407) Blokeffekter i blokforsøgβ1, β2, . . . 451 (439) Effekter fra 2. faktor i to-faktorforsøgδ 260 (256) Konstant, som specificerer teoretisk afvigelse fra 0 (nul)∆t 131 (128) ”Lille” tidsintervalε 345 (331) Afvigelse mellem (regressions)model og data

φ(x) 154 (150) Betegnelse for standardnormaltætheden: φ(x) = (1/√

2π) exp(−x2/2)Φ(x) 154 (150) Betegnelse for standardnormalfordelingen: Φ(x) =

∫ x−∞ φ(t)dt

Γ(.) 169 (166) Gamma-funktionen (matematisk funktion)λ 131 (124) Intensitetsparameteren i Poissonfordelingenµ0 246 (242) H0 middelværdi (hypotetisk værdi for µ)µ 116 (113) (Teoretisk) middelværdi af stokastisk variabelµ Estimat for µν, ν1, ν2 216 (213) Frihedsgrader i t-, F- eller χ2-fordelingen, eksempelvisπ Matematisk konstant (3.14159...)χ2(ν) 218 (215) χ2-fordelingen med ν frihedsgraderρ 379 (367) Korrelationskoefficientρk 451 (439) Effekt fra k’te replikat i faktorforsøgσ2 119 (116) (Teoretisk) varians for stokastisk variabelσ 119 (116) (Teoretisk) standardafvigelse (eller spredning) for stokastisk variabelσ2

0 284 (277) H0 varians (hypotetisk værdi for σ2)

θ, θ 227 (223) Generel betegnelse for en parameter, som man f.eks. vil estimere

. o O o .

116