21
Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet best˚ ar af 30 spørgsm˚ al af ”multiple choice” typen fordelt p˚ a 16 opgaver. Be- svarelserne af ”multiple choice” spørgsm˚ alene anføres ved at udfylde skemaet p˚ a forsiden (denne side), med numrene p˚ a de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at ”sværte” det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ´ et nummer ved et spørgsm˚ al, betragtes spørgsm˚ alet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt ”multiple choice” svar og -1 for et ukorrekt svar. Ubesvarede spørgsm˚ al eller et 6-tal (svarende til “ved ikke”) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenst˚ aende skema. Aflever KUN skemaet! Opgave I.1 I.2 I.3 II.1 I1.2 III.1 III.2 IV.1 IV.2 IV.3 Spørgsm˚ al (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 1 4 2 3 5 2 1 3 3 1 Opgave V.1 V.2 V.3 VI.1 VII.1 VIII.1 VIII.2 IX.1 IX.2 X.1 Spørgsm˚ al (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 2 1 1 2 4 5 3 4 3 5 Opgave X.2 XI.1 XII.1 XII.2 XIII.1 XIII.2 XIV.1 XV.1 XVI.1 XVI.2 Spørgsm˚ al (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 1 1 1 1 4 2 4 1 2 4 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 21; blad lige om og se, at den er der. Fortsæt p˚ a side 2 1

Danmarks Tekniske Universitet Side 1 af 21 sider. : 27 ... fileMultiple choice opgaver Der g˝res opmˆrksom p a, at ideen med opgaverne er, at der er et og kun et rigtigt svar p a

Embed Size (px)

Citation preview

Danmarks Tekniske Universitet Side 1 af 21 sider.

Skriftlig prøve: 27. maj 2010

Kursus navn og nr: Introduktion til Statistik, 02402

Tilladte hjælpemidler: Alle

Dette sæt er besvaret af

(studienummer) (underskrift) (bord nr)

Opgavesættet bestar af 30 spørgsmal af ”multiple choice” typen fordelt pa 16 opgaver. Be-svarelserne af ”multiple choice” spørgsmalene anføres ved at udfylde skemaet pa forsiden(denne side), med numrene pa de svarmuligheder, du mener er de korrekte.

Et forkert svar kan rettes ved at ”sværte” det forkerte svar over og anføre det rigtige istedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end et nummerved et spørgsmal, betragtes spørgsmalet som ubesvaret. Kladde, mellemregninger eller andettillægges ingen betydning, kun svarene i tabellen tæller.

Der gives 5 point for et korrekt ”multiple choice” svar og −1 for et ukorrekt svar. Ubesvaredespørgsmal eller et 6-tal (svarende til “ved ikke”) giver 0 point. Det antal point, der krævesfor, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene.

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstaende skema.Aflever KUN skemaet!

Opgave I.1 I.2 I.3 II.1 I1.2 III.1 III.2 IV.1 IV.2 IV.3Spørgsmal (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)Svar

1 4 2 3 5 2 1 3 3 1

Opgave V.1 V.2 V.3 VI.1 VII.1 VIII.1 VIII.2 IX.1 IX.2 X.1Spørgsmal (11) (12) (13) (14) (15) (16) (17) (18) (19) (20)Svar

2 1 1 2 4 5 3 4 3 5

Opgave X.2 XI.1 XII.1 XII.2 XIII.1 XIII.2 XIV.1 XV.1 XVI.1 XVI.2Spørgsmal (21) (22) (23) (24) (25) (26) (27) (28) (29) (30)Svar

1 1 1 1 4 2 4 1 2 4

Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 21; blad lige omog se, at den er der.

Fortsæt pa side 2

1

Multiple choice opgaver Der gøres opmærksom pa, at ideen med opgaverne er, at der er etog kun et rigtigt svar pa de enkelte spørgsmal. Endvidere er det ikke givet, at alle de anførtealternative svarmuligheder er meningsfulde.

Opgave I

I et rygestopkursus havde man over en periode pa 4 maneder registreret antallet af mandligeog kvindelige deltagere samt hvor mange af disse, der efter kurset var blevet røgfrie. Følgendeantal blev registreret i løbet af de 4 maneder:

Ikke røgfri RøgfriKvinder 91 352Mænd 32 212

Spørgsmal I.1 (1): Et relevant test for hypotesen om, at der ingen forskel er pa andelen afmænd og kvinder der bliver røgfrie efter deltagelse i kurset giver følgende resultat:

1 2 Teststørrelse= 5.91, sa p-værdi< 0.025

2 2 Teststørrelse= 4.86, sa p-værdi< 0.025

3 2 Teststørrelse= 0.96, sa p-værdi> 0.05

4 2 Teststørrelse= 1.96, sa p-værdi< 0.05

5 2 Teststørrelse= 12.44, sa p-værdi< 0.005

6 2 Ved ikke

Spørgsmal I.2 (2): Tidligere gennemførte kurser havde vist, at sandsynligheden for at entilfældigt udvalgt deltager ville blive røgfri var 80%. I et lignende rygestop kursus deltog 20rygere. Hvad er sandsynligheden for, at mindst 18 ud af de 20 deltagere vil være røgfri efterat have deltaget i kurset? (Nedenfor betegner B(x;n, p) fordelingsfunktionen for binomial-fordelingen)

1 2 B(18; 20, 0.80)

2 2 1 − B(18; 20, 0.80)

3 2 1 − B(2; 20, 0.20)

4 2 B(2; 20, 0.20)

5 2 B(17; 20, 0.80)

6 2 Ved ikke

Fortsæt pa side 3

2

Spørgsmal I.3 (3): Hvis man efter et rygestop kursus tilfældigt udspørger nogle af delta-gerne om de er blevet røgfri, hvor mange deltagere skal man som minimum udspørge, for atsandsynligheden for, at mindst 1 af de adspurgte IKKE er blevet røgfri overstiger 50%?

1 2 3

2 2 4

3 2 5

4 2 6

5 2 7

6 2 Ved ikke

Fortsæt pa side 4

3

Opgave II

Det systoliske blodtryk (SBT) blev malt pa 8 parkinson patienter og 21 raske personer.Formalet med undersøgelsen var at undersøge, om der er forskel i SBT mellem de 2 grupper.For parkinson gruppen blev følgende værdier udregnet: y1 = 132.86 og s1 = 15.34, og for deraske personer: y2 = 127.44 og s2 = 18.23. Det antages, at de to populationer kan beskrivesved en normalfordeling.

Spørgsmal II.1 (4): Hvis det antages at de to grupper har samme varians, hvad bliver dateststørrelsen for et tosidet test pa signifikansniveau α = 0.05?

1 2 t = 132.86−127.4416.79·( 1

8+ 1

21)

2 2 t = 132.86−127.44

17.53√

17+ 1

20

3 2 t = 132.86−127.44

17.53√

18+ 1

21

4 2 t = 132.86−127.44

17.53

√182

+ 1212

5 2 t = 132.86−127.4416.79·( 1

7+ 1

20)

6 2 Ved ikke

Spørgsmal II.2 (5): Hvis man ønskede at teste hvorvidt varianserne for de to grupper kunneantages ens, kunne man konstruere et F-test. Ved et sadan test pa 2 % signifikansniveau villeman konkludere følgende: (Bade konklusion og argument skal være i orden)

1 2 Acceptere H0 idet 18.232

15.342 = 1.41 < F0.01(7, 20)

2 2 Forkaste H0 idet 18.232

15.342 = 1.41 > F0.01(20, 7)

3 2 Acceptere H0 idet 18.2315.34 = 1.19 < F0.01(20, 7)

4 2 Forkaste H0 idet 18.2315.34 = 1.19 > F0.01(20, 7)

5 2 Acceptere H0 idet 18.232

15.342 = 1.41 < F0.01(20, 7)

6 2 Ved ikke

Fortsæt pa side 5

4

Opgave III

Arrangørerne af Københavns maraton ønsker at teste om der er en sammenhæng mellemhvor mange maraton løbsdeltagerne tidligere har gennemført, og den tid løbsdeltagerne gen-nemførte de 42.195 km pa til Københavns maraton i maj 2009. I nedenstaende tabel erdeltagerne opdelt i 3 forskellige grupper alt efter hvor mange maraton de tidligere har gen-nemført og løbstiderne er inddelt i 5 forskellige grupper, hvor i.g. star for ikke gennemført:

Løbstid i timer [0;3) [3;4) [4;5) [5;6) i.g. Total0 maraton 51 1281 811 125 194 2462≤ 10 maraton 82 1523 1077 108 134 2924> 10 maraton 92 1812 1298 122 120 3444Total 225 4616 3186 355 448 8830

De forventede frekvenser for hver celle er udregnet og angivet i nedenstaende tabel:

Løbstid i timer [0;3) [3;4) [4;5) [5;6) i.g. Total0 maraton 63 1287 888 99 125 2462≤ 10 maraton 74 1529 1055 118 148 2924> 10 maraton 88 1800 1243 138 175 3444Total 225 4616 3186 355 448 8830

Teststørrelsen kan nu udregnes til: χ2 = (51−63)2

63 + (1281−1287)2

1287 + . . . + (120−175)2

175 = 79.25

Spørgsmal III.1 (6): Konklusionen pa ovenstaende test ved signifikansniveau α = 0.01bliver?

1 2 H0 accepteres idet p-værdi> 0.05

2 2 H0 forkastes idet p-værdi< 0.01

3 2 H0 forkastes idet p-værdi< 0.05

4 2 H0 accepteres idet p-værdi> 0.025

5 2 H0 accepteres idet p-værdi> 0.01

6 2 Ved ikke

Fortsæt pa side 6

5

Spørgsmal III.2 (7): Havde man kun valgt at inddele løbstiderne i følgende 3 grupper: [0;3),[3;5), og [5;∞)(inkl. i.g.-gruppen), sa skulle man ved et test pa signifikansniveau α = 0.05,benytte følgende kritiske værdi:

1 2 χ20.05(4)

2 2 χ20.05(6)

3 2 χ20.025(4)

4 2 χ20.025(6)

5 2 χ20.05(5)

6 2 Ved ikke

Fortsæt pa side 7

6

Opgave IV

Indholdet af tungmetallet Cadmium i dasetun blev malt i tun fra 3 forskellige producenteraf dasetun. Fra hver producent blev der tilfældigt udvalgt 5 daser tun. Følgende mængderaf Cadmium i µg/kg blev malt i de i alt 15 forskellige daser tun:

Producent 1: 57, 52, 62, 49, 43Producent 2: 55, 74, 62, 42, 52Producent 3: 61, 54, 55, 53, 51

Det ønskes at teste, om der er forskel i mængden af Cadmium i dasetun fra de 3 producenter.I nedenstaende tabel ses resultatet for en sædvanlig variansanalyse af indholdet af Cadmiumi de 15 daser:

DF SS MS FProducenter 48.4 24.2 0.35Fejl 838.0 69.8Total 886.4

Spørgsmal IV.1 (8): Kolonnen for frihedsgrader der ikke er udfyldt bliver (nævnt i rækkefølgenproducenter, fejl, total):

1 2 2, 13, 15

2 2 3, 12, 15

3 2 2, 12, 14

4 2 2, 14, 16

5 2 3, 14, 17

6 2 Ved ikke

Spørgsmal IV.2 (9): Hvad er den 3. kvartil (øvre) for Cadmium indholdet hos Producent1?

1 2 52

2 2 54.5

3 2 57

4 2 52.6

5 2 55.75

6 2 Ved ikke

Fortsæt pa side 8

7

Spørgsmal IV.3 (10): Hvad er sε, estimatet for standardafvigelsen for fejlen?

1 2√

69.8

2 2 69.8

3 2 838.0

4 2 0.35

5 2 Kan ikke estimeres ud fra ovenstaende

6 2 Ved ikke

Fortsæt pa side 9

8

Opgave V

En idrætslærer ønsker at teste sine elevers kondition. Han benytter den klassiske Coopertest, hvor det gælder om at løbe sa langt som muligt pa 12 minutter, og han pastar over forsine elever, at landsgennemsnittet for elever i samme klassetrin er 2000 meter.Testen udføres pa i alt 16 elever og gennemsnittet og standardafvigelsen for hvor langt elevernenaede at løbe pa de 12 minutter blev (angivet i meter): y = 1850 og s = 356.

Spørgsmal V.1 (11): Hvis man ved at sammenligne middelværdien for de 16 elever og lands-gennemsnittet ønsker at vise, at de 16 elever HAR en darligere kondition end landsgennem-snittet, hvorledes vil man formulere nul hypotesen (H0) og den alternative hypotese (H1)?

1 2 H0: µ = 1850 og H1: µ > 1850

2 2 H0: µ = 2000 og H1: µ < 2000

3 2 H0: µ = 1850 og H1: µ 6= 1850

4 2 H0: µ = 2000 og H1: µ 6= 2000

5 2 H0: µ = 2000 og H1: µ = 1850

6 2 Ved ikke

Spørgsmal V.2 (12): Hvis det antages, at distancen eleverne løber pa de 12 minutter ernormalfordelt, kan det da konkluderes, at eleverne har en darligere kondition end landsgen-nemsnittet, pa signifikansniveau 5%? (Bade konklusion og argument skal være i orden)

1 2 Nej fordi t = 1850−2000356/

√16

> −t0.05(15)

2 2 Ja fordi t = 1850−2000356/

√16

> −t0.05(15)

3 2 Ja fordi Z = 1850−2000356/

√16

< −z0.05

4 2 Nej fordi Z = 1850−2000356/

√15

> −z0.05

5 2 Nej fordi t = 1850−2000356/

√15

> −t0.05(16)

6 2 Ved ikke

Fortsæt pa side 10

9

Spørgsmal V.3 (13): Hvis det IKKE kunne antages at distancen eleverne løber pa de 12minutter er normalfordelt, hvilket test ville da være egnet til at teste elevernes kondition iforhold til landsgennemsnittet?

1 2 Et fortegns test (sign test)

2 2 Et parret t test

3 2 Et t test med 15 frihedsgrader

4 2 Test for tilfældighed

5 2 Rank-Sum test

6 2 Ved ikke

Fortsæt pa side 11

10

Opgave VI

Fra januar 2010 blev der indført en kommunal madordning i nogle af landets børnehaver.Tilfredsheden med madordningen var meget varierende fra kommune til kommune. Ne-denstaende data stammer fra en undersøgelse der malte hvorvidt forældre i Jylland, pa Fynog pa Sjælland var for eller i mod madordningen.

Jylland Fyn SjællandFor madordningen 160 102 209Imod madordningen 198 110 124

Der udføres det sædvanlige test med nul hypotesen, at andelen af forældre der er for madord-ningen er den samme i Jylland, pa Fyn og pa Sjælland.

Spørgsmal VI.1 (14): Med et signifikansniveau pa 0.01 bliver den kritiske værdi for dettetest?

1 2 χ20.005(2) = 10.597

2 2 χ20.01(2) = 9.210

3 2 χ20.01(3) = 11.345

4 2 χ20.01(6) = 16.812

5 2 χ20.005(3) = 12.838

6 2 Ved ikke

Fortsæt pa side 12

11

Opgave VII

Spørgsmal VII.1 (15): Hvilken af følgende pastande om ikke-parametriske metoder er falsk?

1 2 Et sign-test kan benyttes som alternativ til hypotese test for en middelværdi

2 2 Et sign-test kan benyttes som alternativ til et parret t-test

3 2 Rank sum test kan benyttes som alternativ til t-test for 2 uafhængige stikprøver

4 2 Rank sum test kan benyttes som alternativ til F-test for to varianser

5 2 Sign-test kan benyttes til at teste hypoteser om medianen

6 2 Ved ikke

Opgave VIII

En tilfældig stikprøve af 10 ejendomsmæglere viste, at de skulle fremvise en ejendom til 8, 7,10, 14, 11, 7, 10, 11, 16, 12 forskellige købere før ejendommen blev solgt.

Spørgsmal VIII.1 (16): Ved et test for hypotesen at medianen er lig med 10 købere modalternativet at den er større end 10 med α = 0.05,bliver konklusionen:

1 2 Nul-hypotesen accepteres, idet P (X ≥ 5) = 1− 0.3770 = 0.6230 er større end α = 0.05

2 2 Nul-hypotesen forkastes, idet P (X ≥ 5) = 1 − 0.6367 = 0.3633 er større end α = 0.05

3 2 Nul-hypotesen forkastes, idet P (X ≥ 5) = 1 − 0.8555 = 0.1445 er større end α = 0.05

4 2 Nul-hypotesen forkastes, idet P (X ≥ 5) = 1 − 0.3770 = 0.6230 er større end α = 0.05

5 2 Nul-hypotesen accepteres, idet P (X ≥ 5) = 1− 0.6367 = 0.3633 er større end α = 0.05

6 2 Ved ikke

Spørgsmal VIII.2 (17): Medianen for antallet af fremvisninger af en ejendom bliver?

1 2 10.6

2 2 11

3 2 10.5

4 2 11.75

5 2 10

6 2 Ved ikke

Fortsæt pa side 13

12

Opgave IX

En undersøgelse har vist, at der ved hver femte fødsel opleves komplikationer. Hvis enkvinde far netop 3 børn, hvad er sa risikoen for, at hun ved mindst den ene fødsel opleverkomplikationer?

Spørgsmal IX.1 (18):

1 2 0.23

2 2 1 − 0.23

3 2 0.2

4 2 1 − 0.83

5 2 0.83

6 2 Ved ikke

Spørgsmal IX.2 (19): Undersøgelsen var baseret pa 500 fødsler, hvoraf der altsa var kom-plikationer ved 100 af disse. Hvad er 95% konfidensintervallet for andelen af fødsler medkomplikationer?

1 2 0.2 ± 1.96√

0.2(1−0.2)100

2 2 0.2 ± 1.645√

0.2(1−0.2)500

3 2 0.2 ± 1.96√

0.2(1−0.2)500

4 2 0.2 ± 1.96√

0.2500

5 2 0.2 ± 1.645√

0.2(1−0.2)100

6 2 Ved ikke

Fortsæt pa side 14

13

Opgave X

Herunder ses tæthedsfunktionerne for tre normalfordelinger:

3 4 5 6 7

0.0

0.1

0.2

0.3

0.4

0.5

a

−1.0 −0.5 0.0 0.5 1.0

0.0

0.4

0.8

1.2

b

0 2 4 6 8 10

0.00

0.10

0.20

c

Spørgsmal X.1 (20): Det er oplyst, at den midterste fordeling har en spredning pa σ = 0.3.Hvis man skal nævne de tre fordelinger i rækkefølge efter størrelsen pa spredningen, hvorman nævner fordelingen med den mindste spredning først og fordelingen med den størstespredning til sidst, bliver rækkefølgen?

1 2 a, b, c

2 2 a, c, b

3 2 b, c, a,

4 2 c, a, b

5 2 b, a, c

6 2 Ved ikke

Spørgsmal X.2 (21): 2.5 % og 97.5 % fraktilerne for den midterste fordeling bliver ca.?

1 2 ±0.6

2 2 ±1.6

3 2 ±1.96

4 2 ±1

5 2 ±0.3

6 2 Ved ikke

Fortsæt pa side 15

14

Opgave XI

Pa større universitets hold tilsigter man, at karaktererne er fordelt efter følgende procenterfor bestaede elever:

Karakter 2 4 7 10 12Procent 10 25 30 25 10

Spørgsmal XI.1 (22): Variansen for denne karakterfordelingen er:

1 2 9.5

2 2 0.95

3 2 7

4 2 5

5 2 2.85

6 2 Ved ikke

Fortsæt pa side 16

15

Opgave XII

For at verificere fedtprocenten i oksekød hos en slagter udtages 6 uafhængige stikprøver pahver 10 gram, hvor mængden af fedt blev malt i hver stikprøve. De 6 uafhængige malinger affedt angivet i gram blev: 7.41, 6.20, 6.73, 5.44, 6.20, og 6.55. Antag at data er normalfordelt.

Spørgsmal XII.1 (23): Et 99%-konfidensinterval for det sande indhold af fedt i oksekødetbliver da ca.:

1 2 6.42 ± 4.032 · 0.2682 2 6.42 ± 3.707 · 0.2683 2 6.42 ± 4.032 · 0.2934 2 6.42 ± 3.707 · 0.2935 2 6.42 ± 2.576 · 0.0726 2 Ved ikke

Spørgsmal XII.2 (24): Antag at den sande varians er 0.36. Hvor mange prøver skal mantage i en kommende undersøgelse for at opna en maximal fejl pa 0.2 med 95% konfidens?

1 2 Mindst 35 idet (1.96 · 0.6/0.2)2 = 34.57

2 2 Mindst 13 idet (1.96 · 0.36/0.2)2 = 12.45

3 2 Mindst 25 idet (1.645 · 0.6/0.2)2 = 24.35

4 2 Mindst 20 idet (2.447 · 0.36/0.2)2 = 19.40

5 2 Mindst 54 idet (2.447 · 0.6/0.2)2 = 53.89

6 2 Ved ikke

Fortsæt pa side 17

16

Opgave XIII

Nedenstaende tabel viser data fra en lineær regresionsanalyse:

i 1 2 3 4 5 6 7 8 9 10 11 12xi 5.0 3.4 2.9 4.0 3.6 6.4 3.6 5.4 4.5 0.5 3.0 3.8yi 8.5 6.3 6.3 6.6 5.6 10.5 6.3 10.3 8.2 3.3 5.7 8.7

Til besvarelse af opgaven kan følgende udregningsstørrelser benyttes

n∑i=1

xi = 46.1,n∑

i=1

yi = 86.3, x =1n

n∑i=1

xi = 3.84, y =1n

n∑i=1

yi = 7.19

n∑i=1

(xi − x)2 = 23.85,n∑

i=1

(yi − y)2 = 48.25,n∑

i=1

(xi − x)(yi − y) = 31.42

Spørgsmal XIII.1 (25): Hvad er estimaterne for henholdsvis afskæringen med Y-aksen, a,og hældningskoefficienten, b, i den sædvanlige lineære regressionsmodel: Yi = α + βxi + εi?

1 2 a = 25.4 og b = 2.02

2 2 a = 0.177 og b = 1.32

3 2 a = 25.4 og b = 0.65

4 2 a = 2.13 og b = 1.32

5 2 a = 2.13 og b = 0.65

6 2 Ved ikke

Spørgsmal XIII.2 (26): Estimatet for variansen (s2e) er givet ved:

1 2 (48.25 − (23.85/31.42)2)/10

2 2 (48.25 − (31.422/23.85))/10

3 2 (48.25 − (23.852/31.42))/10

4 2 (23.85 − (31.422/48.25))/10

5 2 (48.25 − (23.85/31.42))/10

6 2 Ved ikke

Fortsæt pa side 18

17

Opgave XIV

Nedenfor ses boxplot for 3 forskellige grupper af data.

a b c

46

810

12

Spørgsmal XIV.1 (27): Hvilket af følgende udsagn er falsk?

1 2 Medianen for datasættet i b er ca. 8

2 2 Den største observation blandt alle 3 datasæt er ca. 12

3 2 Datasættet i boxplot c har klart den mindste varians

4 2 95 % fraktilen for datasættet i boxplot a er ca. 12

5 2 Den øvre kvartil for boxplot c er ca. 7.4

6 2 Ved ikke

Fortsæt pa side 19

18

Opgave XV

For at et taxaselskab tjener penge, skal antallet af kunder for en given taxachauffør somminimum være 4 pr. time. I en periode pa 3 timer observeredes 9 kunder hos en tilfældigudvalgt taxachauffør. Det ønskes at undersøge om der er grund til at tro, at taxaselskabettaber penge pa denne taxachauffør(pa længere sigt)?

Spørgsmal XV.1 (28) P-værdien for en sadan undersøgelse findes ved:

1 2 P-værdi er lig P (X ≤ 9) = 0.242, hvor X ∼ Poisson(12)

2 2 P-værdi er lig 1 − P (X 6= 8) = 0.845, hvor X ∼ Poisson(12)

3 2 P-værdi er lig P (X ≤ 3) = 0.433, hvor X ∼ Poisson(4)

4 2 P-værdi er lig 1 − P (X 6= 2) = 0.762, hvor X ∼ Poisson(4)

5 2 Er ikke mulig at svare pa udfra ovenstaende oplysninger

6 2 Ved ikke

Fortsæt pa side 20

19

Opgave XVI

Nedenfor ses en lineær regressionsanalyse af sammenhængen mellem antal solskinstimer ogantal Birke pollen pr. m3 i København i april maned 2010.

2 4 6 8 10

50

10

01

50

20

02

50

30

0

Solskinstimer

An

tal B

irke

po

llen

pr.

ku

bik

me

ter

Spørgsmal XVI.1 (29) Hvilken korrelationskoefficient beskriver bedst ovenstaende analyse?

1 2 -0.99

2 2 0.99

3 2 0.50

4 2 -0.50

5 2 0.30

6 2 Ved ikke

Fortsæt pa side 21

20

I R er værdierne for solskinstimer gemt i variablen X og værdierne for pollental gemt ivariablen Y . Fra R fas følgende kommandoer og (delvis) output for data:

> fit.evap <- lm(Y ~ X)

> summary(fit.evap)

Call:lm(formula = Y ~ X)

Residuals:Min 1Q Median 3Q Max

-20.914 -8.824 -1.024 10.036 25.792

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) -38.3762 5.7622 -6.66 3.16e-07 ***X 31.1562 0.8706 35.78 < 2e-16 ***---Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1

Spørgsmal XVI.2 (30): Den estimerede lineære sammenhæng er:

1 2 Y = 38.38 · X − 31.16

2 2 Y = 5.76 · X − 38.38

3 2 Y = 35.78 · X − 6.66

4 2 Y = 31.16 · X − 38.38

5 2 Y = 0.87 · X + 5.76

6 2 Ved ikke

21