22
Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 1 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS HIPOTEZĖS DARBO TIKSLAS - išstudijuoti parametrų taškinių ir intervalinių įverčių radimo, parametrinių ir neparametrinių hipotezių tikrinimo uždavinius ir jų taikymą. 1. Teorijos klausimai Suformuluokite parametrų taškinių ir intervalinių įverčių radimo 1. uždavinius. Paaiškinkite dvi termino statistika prasmes. 2. Kokie įverčiai vadinami taškiniais? 3. Apibrėžkite, kokį įvertį vadiname suderintu, nepaslinktu ir efektyviu? 4. Kokie taškiniai įverčiai laikomi gerais? 5. Taškinių įverčių sudarymo būdai (momentų ir didžiausio tikėtinumo 6. metodai). Kokios yra jų teigiamos ir neigiamos pusės? Ką vadiname pasikliautinuoju intervalu ir pasikliovimo lygmeniu? 7. Paaiškinkite pasikliautinojo intervalo sudarymo žingsnius. 8. Kaip keičiasi pasikliautinojo intervalo ilgis: a) didinant imtį; b) mažinant 9. pasikliovimo lygmenį? Kokios statistikos naudojamos sudarant normaliojo skirstinio vidurkio 10. pasikliautinąjį intervalą, kai dispersija žinoma ir kai ji nežinoma? Kaip sudaromas normaliojo skirstinio dispersijos pasikliautinasis 11. intervalas, kai vidurkis ir dispersija nežinomi? Kaip randamas įvykio tikimybės pasikliautinasis intervalas? 12. Paaiškinkite statistinės hipotezės sąvoką ir pateikite pavyzdžių. 13. Kokią hipotezę vadiname nuline, kokią - alternatyvia? 14. Kokią hipotezę vadiname parametrine, kokią - neparametrine? Pateikite 15. pavyzdžių. Paaiškinkite pirmosios ir antrosios rūšies klaidos bei reikšmingumo 16. lygmens prasmes. Ką vadiname kritine reikšme ir kritine sritimi? Kaip parenkama kritinė 17. sritis? Paaiškinkite hipotezės tikrinimo žingsnius. 18. Paaiškinkite reikšmingumo lygmens ir p-reikšmės prasmes. 19. Ką vadiname kriterijaus galia? 20. Suformuluokite suderinamumo hipotezę. Pateikite pavyzdžių. 21. Kokie kriterijai dažniausiai naudojami suderinamumo hipotezių tikrinimui? 22. Paaiškinkite suderinamumo χ 2 kriterijaus sudarymo schemą. 23.

4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

  • Upload
    others

  • View
    15

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 1

4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS HIPOTEZĖS

DARBO TIKSLAS - išstudijuoti parametrų taškinių ir intervalinių įverčių radimo, parametrinių ir neparametrinių hipotezių tikrinimo uždavinius ir jų taikymą.

1. Teorijos klausimai

Suformuluokite parametrų taškinių ir intervalinių įverčių radimo 1.uždavinius.Paaiškinkite dvi termino statistika prasmes.2.Kokie įverčiai vadinami taškiniais?3.Apibrėžkite, kokį įvertį vadiname suderintu, nepaslinktu ir efektyviu?4.Kokie taškiniai įverčiai laikomi gerais?5.Taškinių įverčių sudarymo būdai (momentų ir didžiausio tikėtinumo 6.metodai). Kokios yra jų teigiamos ir neigiamos pusės?Ką vadiname pasikliautinuoju intervalu ir pasikliovimo lygmeniu?7.Paaiškinkite pasikliautinojo intervalo sudarymo žingsnius.8.Kaip keičiasi pasikliautinojo intervalo ilgis: a) didinant imtį; b) mažinant 9.pasikliovimo lygmenį?Kokios statistikos naudojamos sudarant normaliojo skirstinio vidurkio 10.pasikliautinąjį intervalą, kai dispersija žinoma ir kai ji nežinoma?Kaip sudaromas normaliojo skirstinio dispersijos pasikliautinasis 11.intervalas, kai vidurkis ir dispersija nežinomi?Kaip randamas įvykio tikimybės pasikliautinasis intervalas?12.Paaiškinkite statistinės hipotezės sąvoką ir pateikite pavyzdžių.13.Kokią hipotezę vadiname nuline, kokią - alternatyvia?14.Kokią hipotezę vadiname parametrine, kokią - neparametrine? Pateikite 15.pavyzdžių.Paaiškinkite pirmosios ir antrosios rūšies klaidos bei reikšmingumo 16.lygmens prasmes.Ką vadiname kritine reikšme ir kritine sritimi? Kaip parenkama kritinė 17.sritis? Paaiškinkite hipotezės tikrinimo žingsnius.18.Paaiškinkite reikšmingumo lygmens ir p-reikšmės prasmes.19.Ką vadiname kriterijaus galia?20.Suformuluokite suderinamumo hipotezę. Pateikite pavyzdžių.21.Kokie kriterijai dažniausiai naudojami suderinamumo hipotezių tikrinimui?22.

Paaiškinkite suderinamumo χ2 kriterijaus sudarymo schemą.23.

Page 2: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 2

2. Tipinių uždavinių sprendimas

2.1. Normaliojo skirstinio parametrų įverčiai

Užduotis. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Atsitiktinės imties realizacija įrašyta katalogo D:\duomenys faile elektros lemputes.dat . Reikia rasti elektros lempučių degimo laiko vidurkio ir dispersijos taškinius įverčius ir pasikliautinuosius intervalus. Tarkime, kad stebime normalųjį atsitiktinį dydį

X~ N µ σ2,( ) , čia kintamasis X yra lemputės degimo laikas (valandomis).

Parametrai µ ir σ2 nežinomi.

Sprendimas. Įvedame duomenis.

ORIGIN 1:=

x READPRN "D:\duomenys\elektros lemputes.dat"( ):=

Išvedame pirmuosius 10 imties elementų.

Vidurkio pasikliautinojo intervalo radimo žingsniai:

1. Randame nežinomų skirstinio parametrų taškinius įverčius. Vidurkio taškinis įvertis: xvid mean x( ):= xvid 2017.20= .

Dispersijos taškinis įvertis: s Stdev x( ):= s 100.62= s2 10124.05=

Apskaičiuojame imties didumą n.

x

112345678910

2037193620432099204320511958202820342193

= n length x( ):=

n 55=

Page 3: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 3

α 0.05:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.95

. s2 10124.1=s Stdev x( ):=1. Randame parametro taškinį įvertį

Dispersijos pasikliautinojo intervalo radimo žingsniai:

Išvada, Su 95% garantija galime teigti, kad elektros lempučių vidutinis degimo laikas yra nuo 1990 iki 2044.4 valandų.

. PI1-α µ( )[ ] 1990 2044.4( )=

PI1-α µ( )[ ] xvids

nt1-α/2 ; n-1[ ]⋅− xvid

s

ntα/2 ; n-1[ ]⋅−

:=

1 α−( ) 0.95=Apskaičiuojame populiacijos vidurkio pasikliautinąjį intervalą.

5.

t1-α/2 ; n-1[ ] 2.005=t1-α/2 ; n-1[ ] qt 1α2

− n 1−,

:=

tα/2 ; n-1[ ] 2.005−=tα/2 ; n-1[ ] qtα2

n 1−,

:=

Randame Stjudento skirstinio α/2 ir 1-α/2 lygmens kvantilius tα/2 ; n-1

ir t1-α/2 ; n-1 , tenkinančius lygtį

P( tα/2 ; n-1 < Xvid µ−

Sn⋅ < t1-α/2 ; n-1 ) = 1- α ,

arba pertvarkytą lygtį

P ( Xvid - S

nt1-α/2 ; n-1 < µ < Xvid - S

ntα/2 ; n-1 ) = 1- α .

4. kuri turi Stjudento skirstinį su n-1 laisvės laipsnių.

,TXvid µ−

Sn⋅

3. Pasikliautinojo intervalo sudarymui parenkame statistiką

. α 0.05:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.95

Page 4: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 4

Išvada, Su 95% garantija galime teigti, kad elektros lempučių degimo laiko dispersija yra intervale nuo 7175,3 iki 15362,6 .

. PI1-α σ2( ) 7175.3 15362.6( )=

PI1-α σ2( ) s2 n 1−( )⋅

χ2( )1 α/2 ; n-1−

s2 n 1−( )⋅

χ2( )α/2 ; n-1

:=

1 α− 0.95=Apskaičiuojame populiacijos dispersijos pasikliautinąjį intervalą.

5.

χ2( )1 α/2 ; n-1−

76.19=χ2( )1 α/2 ; n-1−

qchisq 1α2

− n 1−,

:=

χ2( )α/2 ; n-1

35.59=χ2( )α/2 ; n-1

qchisqα2

n 1−,

:=

Randame chi-kvadrato skirstinio α/2 ir 1-α/2 lygmens kvantilius χ2( )

α/2 ; n-1 ir χ2( )

1 α/2 ; n-1−, tenkinančius lygtį

P( χ2( )α/2 ; n-1

< S2 n 1−( )⋅

σ2< χ2( )

1-α/2 ; n-1) = 1- α ,

arba pertvarkytą lygtį

P ( S2 n 1−( )⋅

χ2( )1-α/2 ; n-1

< σ2 < S2 n 1−( )⋅

χ2( )α/2 ; n-1

) = 1- α .

4.

kuri turi chi-kvadrato skirstinį su n-1 laisvės laipsnių.

,χ2 S2 n 1−( )⋅

σ2

3. Pasikliautinojo intervalo sudarymui parenkame statistiką

Page 5: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 5

z1 α/2−[ ] 1.64=z1 α/2−[ ] qnorm 1α2

− 0, 1,

:=

zα/2[ ] 1.64−=zα/2[ ] qnormα2

0, 1,

:=

4. Randame standartinio normaliojo skirstinio α/2 ir 1-α/2 lygmens kvantilius zα/2 ir z1 α/2− , tenkinančius lygtį

P( zα/2 < p p−

p 1 p−( )⋅n⋅ < z1 α/2− ) = 1- α ,

arba pertvarkytą lygtį

P ( p z1 α/2−p 1 p−( )⋅

n⋅− < p < p zα/2

p 1 p−( )⋅n

⋅− ) = 1- α.

kuri turi standartinį normalųjį skirstinį Z~N(0; 1) .

,Zp p−

p 1 p−( )⋅n⋅

3. Pasikliautinojo intervalo sudarymui parenkame statistiką

. α 0.10:=, tuomet 2. Parenkame pasikliovimo lygmenį 1-α = 0.90

p 0.35=p35100

:=

1. Randame parametro p taškinį įvertį p

Pasilkliautinojo intervalo radimo žingsniai:

Sprendimas. Tarkime, kad X yra darbuotojo atsakymas į klausimą. Tegul X įgyja reikšmę (jeigu darbuotojas nepritaria įmonėje vykdomoms reformoms) arba 0 (priešingu atveju). Tuomet X skirstinys yra binominis X~B(1; p), čia p - dalis įmonės darbuotojų nepritariančių reformoms.

Užduotis. Apklausus 100 atsitiktinai atrinktų įmonės darbuotojų, paaiškėjo, kad prieš įmonėje vykdomas reformas pasisakė 35 darbuotojai. Raskite darbuotojų, nepritariančių įmonėje vykdomoms reformoms, dalies 90% pasikliautinąjį intervalą.

2.2. Įvykio tikimybės įverčiai

Page 6: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 6

α 0.05:=

2. Parenkame reikšmingumo lygmenį µ µ0≠Ha:

µ µ0H0:

µ0 2000:=

1. Suformuluojame statistinę hipotezę

Hipotezės tikrinimo žingsniai:n 55=n length x( ):=Imties didumas

x READPRN "D:\duomenys\elektros lemputes.dat"( ):=

ORIGIN 1:=

Sprendimas. Įvedame duomenis.

Užduotis. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Imties duomenys įrašyti faile elektros lemputes.dat . Reikia patikrinti hipotezę, kad vidutinis lempučių degimo laikas lygus 2000 valandoms. Tarkime, kad stebime normalųjį atsitiktinį

dydį X~ N µ σ2,( ) , čia kintamasis X yra lemputės degimo laikas (valandomis).

Parametrai µ ir σ2 nežinomi.

2.3. Hipotezės apie normaliojo skirstinio vidurkio reikšmes

Išvada. Su 90% garantija galime teigti, kad įmonėje vykdomoms reformoms nepritaria nuo 24 iki 46 procentų dirbančiųjų.

PI1-α p( )[ ] 0.24 0.46( )=

PI1-α p( )[ ] p z1 α/2−[ ] p 1 p−( )⋅n

⋅− p zα/2[ ] p 1 p−( )⋅n

⋅−

:=

pasikliautinąjį intervalą.

1 α− 0.9= 5. Apskaičiuojame tikimybės p

Page 7: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 7

Išvada. Hipotezė H0 neatmetama, nes timt ∈ W0 . Teiginys, kad vidutinis elektros lempčių degimo laikas yra 2000 valandų neprieštarauja imties duomenims. Tačiau gali būti ir kitų teisingų nulinių hipotezių. Pavyzdžiui, vidutinis lemučių degimo laikas yra 1995 arba 2015 valandų. Patikrinkite tai savarankiškai.

timt 1.268=timtxvid µ0−( )

sn⋅:=

s 100.62=s Stdev x( ):=

xvid 2017.20=xvid mean x( ):=

Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę timt ir priimame sprendimą. Jeigu timt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.

5.

Kritinę sritį sudaro aibėWK= (-∞ ; tα/2 ; n-1 )∪ ( t1-α/2 ; n-1 ;+ ∞ ) = (-∞ ; -2.005)∪ (2.005;+∞ ),

o neatmetimo sritį aibė W0=[ tα/2 ; n-1 ; t1-α/2 ; n-1 ] = (-2.005; 2.005).

t1-α/2 ; n-1[ ] 2.005=t1-α/2 ; n-1[ ] qt 1α2

− n 1−,

:=

tα/2 ; n-1[ ] 2.005−=tα/2 ; n-1[ ] qtα2

n 1−,

:=

Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra dvipusė, randame du Stjudento skirstinio kvantilius (dvi kritines reikšmes) tα/2 ; n-1 ir t1-α/2 ; n-1 .

4.

kuri turi Stjudento skirstinį su n-1 laisvės laipsnių.

,TXvid µ0−( )

Sn⋅

3. Hipotezės tikrinimui parenkame statistiką

Page 8: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 8

Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę timt.

t 4− 3.9−, 4..:= O 0.05:=

4 0 40

0.1

0.2

0.3

0.4

dt t n 1−,( )

O

tα/2 ; n-1[ ] t1-α/2 ; n-1[ ]

t timt,timt

Kritinė sritis WK

H0 neatmetimo sritis W0

Kritinė sritisWK

Matome, kad stebėta kriterijaus statistikos reikšmė t imt patenka į sritį W0, todėl nulinė hipotezė H0 neatmetama.Panaudoję Mathcad programavimo galimybes, sudarysime funkciją, kuri patikrina ar stebėtoji kriterijaus statistikos reikšmė timt patenka į sritį W0 ir išveda hipotezės tikrinimo atsakymą.

Žemiau pateikta Mathcad funkcija Atsakymas patikrina ar stebėta statistikos reikšmė t imt patenka į sritį W0. Jeigu timt patenka į sritį W0, tai išvedamas tekstas "H 0 neatmesta", priešingu atveju - " H0 atmesta" Po to, skaičiuojamas stebėtas statistikos reikšmingumo lygmuo (p-reikšmė) , kuris apvalinamas 3 ženklų po kablelio tikslumu.

Funkcijos Atsakymas reikšmė yra vektorius, kurio pirmoji komponentė yra tekstas "H0 neatmesta" arba "H0 atmesta", o antroji komponentė - "p=p-reikšmė". Jeigu gauname , kad p-reikšmė yra mažesnė už pasirinktą reikšmingumo lygmenį α , tai hipotezė H0 atmetama.

Page 9: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 9

Atsakymas tekstas 1 "Ho neatmesta"←

tekstas 1 tα/2 ; n-1[ ] timt≤ t1-α/2 ; n-1[ ]≤if

tekstas 1 "Ho atmesta"← otherwise

p 2 min pt timt n 1−,( ) 1 pt timt n 1−,( )−,( )⋅←

p substr num2str round p 3,( )( ) 0, 6,( )←

tekstas 2 concat "p=" p,( )←

tekstas

:=

Atsakymas"Ho neatmesta"

"p=0.21"

=

Vienpusių alternatyvų atveju naudojama ta pati statistika ir panašiai sudaromos kritinės sritys. Kai alternatyva yra

Ha: µ µ0<apskaičiuojame vieną kritinę reikšmę kritinėsritis vienpusė kairė( ).

tα ; n-1[ ] qt α n 1−,( ):= tα ; n-1[ ] 1.674−=

Kritinė sritis yra aibė WK= (-∞ ; tα ; n-1 )= (-∞ ; -1.675), o hipotezės H0

neatmetimo sritis aibė W0=[ tα ; n-1 ; + ∞ ) = [-1.674; +∞ ).

Išvada. Hipotezė H0 neatmetama, nes timt ∈ W0 . Teiginys ,,vidutinis elektros lempčių degimo laikas yra 2000 valandų'' neprieštarauja imties duomenims. Su 95% garantija mes negalime teigti, kad jis mažesnis už 2000 valandų.

Pateiksime Mathcad funkciją Atsakymas1K, kuri išveda hipotezės tikrinimo rezultatą ir p-reikšmę, kai kritinė sritis yra vienpusė kairė.

Atsakymas1K tekstas 1 "Ho neatmesta"← timt tα ; n-1[ ]≥if

tekstas 1 "Ho atmesta"← otherwise

p pt timt n 1−,( )←

p substr num2str round p 3,( )( ) 0, 6,( )←

tekstas 2 concat "p=" p,( )←

tekstas

:=

Page 10: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 10

Atsakymas1K"Ho neatmesta"

"p=0.895"

=

Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją ( kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę timt.

t 4− 3.9−, 4..:= O 0.05:=

4 2 0 2 40

0.1

0.2

0.3

0.4

dt t n 1−,( )

O

tα ; n-1[ ]

t timt,timt

Kritinė sritis WK H0 neatmetimo sritis W0

Matome, kad stebėta kriterijaus statistikos reikšmė t imt patenka į sritį W0, todėl nulinė hipotezė H0 neatmetama.

2.4. Hipotezė apie dviejų normaliųjų skirstinių vidurkių lygybę

Hipotezių apie dviejų vidurkių lygybę tikrinimui naudojamos statistikos turi Stjudento skirstinius, todėl atitinkami kriterijai vadinami Stjudento t kriterijais. Skirtingi t kriterijai taikomi priklausomoms ir nepriklausomoms imtims. Vertinantvidurkių skirtumus svarbi ir duomenų sklaida - stebimų dydžių dispersijos, todėl skirtingi Stjudento t kriterijai taikomi, kai abiejų populiacijų dispersijos lygios ir tais atvejais kai populiacijų dispersijos skiriasi statistiškai reikšmingai. Čia pateiksime hipotezės apie vidurkių lygybę tikrinimo pavyzdį nepriklausomoms imtims, kai populiacijų dispersijos yra lygios.

Page 11: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 11

kuri turi Stjudento skirstinį su m+n-2 laisvės laipsnių.

, ,TXvid Yvid−( )

n 1−( ) Sx2⋅ m 1−( ) Sy

2⋅+

n m⋅ n m+ 2−( )⋅n m+

3. Hipotezės tikrinimui parenkame statistiką

.α 0.05:=2. Parenkame reikšmingumo lygmenį µx µy>Ha:

µx µyH0:

1. Suformuluojame statistinę hipotezę

Hipotezės tikrinimo žingsniai:

m 40=m length y( ):=

n 60=n length x( ):=Imčių didumai:

y READPRN "D:\duomenys\naktine pamaina.dat"( ):=

x READPRN "D:\duomenys\dienine pamaina.dat"( ):=

ORIGIN 1:=

Sprendimas. Įvedame duomenis.

Užduotis. Gamykla dirba dviem pamainomis. Jos vadovai nori sužinoti ar darbo našumas dieninėje ir naktinėje pamainose yra vienodas. Atsitiktinai atrinkta 100 darbininkų (60 dirbančių dieninėje, 40 - naktinėje pamainose) ir užregistruota, kiek detalių jie pagamino per pamainą. Gautų imčių duomenys įrašyti failuose dienine pamaina.dat ir naktine pamaina.dat . Reikia patikrinti hipotezę: ar abiejuose pamainose vienas darbininkas pagamina vidutiniškai tiek pat

detalių. Tarkime, kad stebime normaluosius atsitiktinius dydžius X~ N µx σ2,( ) ir Y~ N µy σ2,( ) , čia X yra dieninės pamainos darbininko pagamintų detalių

skaičius, o Y - naktinės pamainos darbininko. Parametrai µx , µy ir σ2 nežinomi.

Page 12: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 12

2.5. Hipotezė apie dviejų normaliųjų skirstinių dispersijų lygybę

Išvada. Hipotezė H0 atmetama, nes timt ∈ WK . Statistiškai įrodyta, kad dieninės pamainos darbininkas pagamina vidutiniškai daugiau detalių lyginant su naktinės pamainos darbininku.

timt 10.695=

timtxvid yvid−( )

n 1−( ) sx2⋅ m 1−( ) sy

2⋅+

n m⋅ n m+ 2−( )⋅[ ]n m+

⋅:=

sy 5.39=sy Stdev y( ):=

sx 4.86=sx Stdev x( ):=

yvid 118.95=yvid mean y( ):=

xvid 130.03=xvid mean x( ):=

Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę timt ir priimame sprendimą. Jeigu timt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.

5.

Kritinę sritį sudaro aibė WK= (t1-α ; n m+ 2− ; + ∞ ) = (1.661; +∞ ), o

H0 neatmetimo sritį aibė W0=( ∞− ; t1-α ; n m+ 2− ] = (-∞ ; 1.661].

t1-α ; n m+ 2−[ ] 1.661=t1-α ; n m+ 2−[ ] qt 1 α− n m+ 2−,( ):=

Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra vienpusė , randame vieną Stjudento skirstinio kvantilį (kritinę reikšmę) t1-α ; n m+ 2− .

4.

Page 13: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 13

kuri turi Fišerio skirstinį su n-1 ir m-1 laisvės laipsnių.

,FSx

2

Sy2

3. Hipotezės tikrinimui parenkame statistiką

. α 0.05:=2. Parenkame reikšmingumo lygmenį

σx2 σy

2≠Ha:

σx2 σy

2H0:

1. Suformuluojame statistinę hipotezę Hipotezės tikrinimo žingsniai:

m 40=m length y( ):=

n 60=n length x( ):=Imčių didumai:

y READPRN "D:\duomenys\naktine pamaina.dat"( ):=

x READPRN "D:\duomenys\dienine pamaina.dat"( ):=

ORIGIN 1:=

Sprendimas.

lygybę. Hipotezė apie dispersijų lygybę svarbi sprendžiant ir kitus uždavinius. Pavyzdžiui, tiriant kainų stabilumą, dviejų testų rezultatų homegeniškumą ir panašiai. Šiame skyrelyje pateiksime hipotezės apie dispersijų lygybę tikrinimo pavyzdį dviems nepriklausomoms imtims. Imtys yra tos pačios kaip ir skyrelyje

3.4.2.4, t.y. stebime normaliuosius atsitiktinius dydžius X~ N µx σx2,( ) ir

Y~ N µy σy2,( ) , čia X yra vieno dieninės pamainos darbininko pagamintų

detalių skaičius, o Y - naktinės pamainos darbininko. Parametrai µx , µy , σx2

ir σy2 nežinomi. Reikia patikrinti hipotezę apie dispersijų lygybę.

Nuo to, ar dviejų populiacijų dispersijas galima laikyti lygiomis, priklauso Stjudento kriterijaus statistika, kuri taikoma tikrinant hipotezę apie vidurkių

Page 14: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 14

Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisinga), hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir stebėtą statistikos reikšmę Fimt.

Išvada. Hipotezė H0 neatmetama, nes Fimt ∈ W0 . Teiginys, kad darbininkų pagamintų detalių skaičiaus dispersija lygios abiejuose pamainose neprieštarauja imties duomenims.

Fimt 0.814=Fimtsx

2

sy2

:=

sy 5.39=sx 4.86=

sy Stdev y( ):=sx Stdev x( ):=

Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę Fimt ir priimame sprendimą. Jeigu Fimt ∈ W0 , tai hipotezė H0 neatmetama, priešingu atveju ji atmetama ir priimama Ha.

5.

Kritinę sritį sudaro aibė WK= ( 0; Fα/2 ; n-1; m-1 )∪ (F1-α/2 ; n-1; m-1 ; + ∞ ) =

( 0; 0.57 )∪ ( 1.816; +∞ ),

o neatmetimo sritį aibė

W0=[ Fα/2 ; n-1; m-1 ; F1-α/2 ; n-1; m-1 ] = [ 0.57; 1.816 ].

F1-α/2 ; n-1; m-1[ ] 1.816=F1-α/2 ; n-1; m-1[ ] qF 1α2

− n 1−, m 1−,

:=

Fα/2 ; n-1; m-1[ ] 0.57=Fα/2 ; n-1; m-1[ ] qFα2

n 1−, m 1−,

:=

Randame hipotezės H0 kritinę sritį WK ir neatmetimo sritį W0. Kadangi šiuo atveju kritinė sritis yra dvipusė, randame du Fišerio skirstinio kvantilius (dvi kritines reikšmes) Fα/2 ; n-1; m-1 ir F1-α/2 ; n-1; m-1 .

4.

Page 15: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 15

Uždavinys. Iš didelės elektros lempučių siuntos atsitiktinai atrinktos 55 elektros lemputės ir išmatuotas jų degimo laikas (valandomis). Imties duomenys įrašyti faile elektros lemputes.dat . Reikia patikrinti hipotezę , kad imtis gauta iš

populiacijos, kurios skirstinys yra normalusis, t.y. X~ N µ σ2,( ) , čia kintamasis

X yra lemputės degimo laikas (valandomis), parametrai µ ir σ2 nežinomi.

Suderinamumo hipotezių tikrinimui yra siūlomi keli kriterijai. Mes naudosime χ2 kriterijų, kurį įvedė Pirsonas (K. Pearson).

. /X~ N µ σ2,( )Ha: ,X~ N µ σ2,( )H0:

Nagrinėsime stebimo skirstinio ir aprioriškai pasirinkto teorinio skirstinio atitikimo problemą, t.y. tikrinsime ar turimas empirinis skirstinys suderinamas su teoriniu modeliu. Formaliai statistinę hipoteze apie tai, kad mūsų imtis gauta iš populiacijos, kurios skirstinys yra normalusis užrašysime

2.6. Suderinamumo hipotezės

Kritinė sritis

WK

H0 neatmetimo sritis W0

Kritinė sritis WK

Fimt 0 0.5 1 1.5 2 2.5 3

0

0.4

0.8

1.2

1.6

dF F n 1−, m 1−,( )

O

Fα/2 ; n-1; m-1[ ] F1-α/2 ; n-1; m-1[ ]

F Fimt,

O 0.2:=F 0 0.05, 3..:=

Page 16: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 16

Statistikos χ2 formulėje Oj yra skirtingų imties reikšmių (kategorijų) dažniai, jei stebimas diskretusis kintamasis arba intervaliniai dažniai, jei stebimas tolydusis kintamasis, k - kategorijų arba intervalų skaičius, r - skirstinio parametrų, įvertinamų pagal imties duomenis skaičius, Ej - tikėtinieji dažniai (teoriniai dažniai). Pastaba: Kai skirstinio parametrai žinomi, tai r=0. Kai skirstinio

parametrai nežinomi, tai χ2 kriterijus taikomas korektiškiau (teisingiau), jei skirstinio parametrų taškiniai įverčiai randami maksimalaus tikėtinumo metodu, taikomu grupuotiems duomenims. Kai tolydžiųjų skirstinių šeimų, priklausančių tik nuo poslinkio ir mąstelio parametrų (pvz. normaliojo skirstinio) nežinomų parametrų įverčiai randami maksimalaus tikėtinumo metodu, taikomu negrupuotiems duomenims

siūloma taikyti tikslesnį, modifikuotą χ2 kriterijų, kurį pasiūlė rusų statistikas L. Bolševas .

kuri turi χ2 skirstinį su k-r-1 laisvės laipsnių.

,χ2

1

k

j

Oj Ej−( )2

Ej∑

=

3. Hipotezės tikrinimui parenkame statistiką

. α 0.05:=2. Parenkame reikšmingumo lygmenį

/X~ N xvid. s2,( )Ha:

X~ N xvid. s2,( )H0:

1. Užrašome statistinę hipotezę

Hipotezės tikrinimo žingsniai:

. n 55=n length x( ):=Imties didumas:

x READPRN "D:\duomenys\elektros lemputes.dat"( ):=

ORIGIN 1:=

Sprendimas.

Page 17: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 17

histograma a imtis,( ) ν hist a imtis,( )←

b2 i⋅ 1− ai←

b2 i⋅ ai←

c2 i⋅ 1− 0←

c2 i⋅ ν i← i last a( )≠if

c2 i⋅ 0← otherwise

i 1 last a( )..∈for

augment b c,( )

:=

Nubrėšime empirinės tankio funkcijos grafiką pasinaudodami funkcija :

ai a1 i 1−( ) h⋅+:=i 2 k..:=

h 90=hak 1+ a1−

k:=

ak 1+ 2290:=a1 1750:=

, tai k 6:=Jeigu parenkame IP 496=IP xmax xmin−:=

xmax 2287=xmin 1791=

xmax max x( ):=xmin min x( ):=

Pasirenkame intervalą (a1 ; ak 1+ ] su savybe a1 xmin≤ ak 1+ xmax≥, ,

pasistengiant, kad intervalo ak 1+ a1− ilgis būtų kiek galima artimesnis imties pločiui IP xmax xmin− ,

o dalinių intervalų ilgis h būtų "gražus" skaičius.

1 3.322 log n( )⋅+ 6.781=

Kai duomenų aibė simetriška, tai intervalų skaičių k patartina pasirinkti artimą skaičiui

Pagal imties duomenis apskaičiuojame kriterijaus statistikos reikšmę

χ2( )imt

.

4.

Page 18: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 18

x histograma a x,( ) 1⟨ ⟩:=

∆∆∆∆1

n h⋅histograma a x,( ) 2⟨ ⟩⋅:=

1750 1840 1930 2020 2110 2200 22900

0.001

0.002

0.003

0.004

0.005

∆∆∆∆

x

Normalusis atsitiktinis dydis įgyja reikšmes nuo ∞− iki ∞ , todėl formaliai turime pakeisti pirmojo ir paskutiniojo intervalų kraštinius taškus.

b a:= b1 ∞−:= b k 1+ ∞:=

Skaičiuojame stebėtus intervalinius dažnius

o hist b x,( ):=

Naudodamiesi teorinio skirstinio (hipotezės H0 formuluotėje nurodytas normalusis skirstinys) savybėmis, apskaičiuojame, kiek kintamojo reikšmių turėtų patektų į kiekvieną intervalą, jeigu hipotezė apie kintamojo X skirstinį būtų teisinga.

j 1 k..:=

Page 19: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 19

Apskaičiuokime imties vidurkį ir dispersiją grupuotiems duomenims:

xvid1n

1

k

i

ai ai 1++

2oi⋅∑

=⋅:= xvid 2015.91=

s1

n 1−1

k

i

ai ai 1++

2xvid−

2

oi⋅∑=

⋅:= s 99.22=

ej pnorm b j 1+ xvid, s,( ) pnorm b j xvid, s,( )−( ) n⋅:=

b

1− 10307×

1840

1930

2020

2110

2200

1 10307×

= o

3

6

18

21

5

2

= e

2.097

8.42

17.591

17.176

7.87

1.851

=

Taikant χ2 kriterijų reikalaujama, kad kiekviename intrevale tikėtinas dažnis ei būtų ne mažesnis už 5. Intervalus, kuriuose tikėtinas dažnis yra mažiau kaip 5, reikia jungti su gretimais intervalais, nes priešingu atveju išvados gali būti klaidingos. Mūsų pavyzdyje yra du tokie intervalai (pirmas ir paskutinis), nes

e1 2.097= ir e6 1.851= .

Sujungsime du pirmuosius ir du paskutinius intervalus ( iš vektoriaus b pašalinsime du taškus 1840 ir 2200). Tam sudarysime funkciją pasalinti V c,( ) , kuri pašalina vektoriaus V koordinatę

Vc (vektoriaus V ilgis sumažėja vienetu).

Page 20: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 20

Pastaba. Skaičius 1 10307× yra "kompiuterio begalybė".

e

10.81

17.58

16.99

9.62

=o

9

18

21

7

=b

1− 10307×

1930

2020

2110

1 10307×

=

e j pnorm b j 1+ xvid, s,( ) pnorm b j xvid, s,( )−( ) n⋅:=

s 105.1=s1

n 1−1

k

i

ai ai 1++

2xvid−

2

oi⋅∑=

⋅:=

xvid 2015.91=xvid1n

1

k

i

ai ai 1++

2oi⋅∑

=

⋅:=

j 1 k..:=

k 4=k rows o( ):=

e 0:=o hist b x,( ):=

Naujai sudarytiems intervalams apskaičiuojame tikėtinus dažnius ir stebėtą kriterijaus statistikos reikšmę .

a pasalinti a 5,( ):=b pasalinti b 5,( ):=

a pasalinti a 2,( ):=b pasalinti b 2,( ):=

pasalinti V c,( ) i 1←

Ui Vj←

i i 1+←

j c≠( )if

j 1 rows V( )..∈for

U

:=

Page 21: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 21

o e−

1.81−

0.42

4.01

2.62−

= o e−( )2

3.29

0.18

16.07

6.85

=

χ2( )imt

j

o j e j−( )2

e j∑:= χ2( )

imt 1.973=

5. Randame hipotezės H0 kritinę sritį WK , neatmetimo sritį W0 ir priimame

sprendimą. Jeigu, χ2( )imt

∈ W0 , tai hipotezė H0 neatmetama, priešingu

atveju ji atmetama ir priimama Ha . Kadangi šiuo atveju kritinė sritis yra

vienpusė dešinė, randame vieną χ2 skirstinio kvantilį χ2( )1-α ; k r− 1−

,

čia k=4, r=2, nes du parametrai įvertinti, pagal imties duomenis.

χ2( )1 α ;1−

qchisq 1 α− 1,( ):= χ2( )1 α ;1−

3.841=

Kritinę sritį sudaro aibė

WK= ( χ2( )1-α ; 1

; + ∞ ) = (3.841; +∞ ),

o H0 neatmetimo sritį aibė

W0=[ 0 ; χ2( )1-α ; 1

] = [ 0; 3.841].

Grafiškai pavaizduosime kriterijaus statistikos tankio funkciją (kai H0 teisnga), hipotezės H 0 kritinę sritį WK , neatmetimo sritį W0 ir

stebėtą statistikos reikšmę χ2( )imt

:

χ2 0 0.01, 5..:= O 0.3:=

Page 22: 4 laboratorinis darbas. PARAMETRŲ ĮVERČIAI IR STATISTINĖS ...kriluko/Tikimybi%f8_Teorija/4%20... · Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis

Nuotolinio mokymo kursas Tikimybių teorija ir matematinė statistika 4 laboratorinis darbas

KAUNO TECHNOLOGIJOS UNIVERSITETAS, Taikomosios matematikos katedra, 2003 22

0 1 2 3 4 50

0.4

0.8

1.2

1.6

χ2( )1 α ;1−

χ2( )imt

H0 neatmetimo sritis W0

Kritinė sritis WK

Išvada. Hipotezė H0 neatmetama, nes χ2( )imt

∈ W0 . Teiginys, kad elektros

lemputės degimo laikas turi normalųjį skirstinį, neprieštarauja imties duomenims.