26
Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi • Normal dağılan iki kütle ortalamasının farkını test etmek için kütle varyanslarının bilinip bilinmemesine göre testler yapılır. 1) Kütle varyanslarının ( 1 2 ve 2 2 ) bilinmesi durumu: • Normal dağılan iki kütlenin varyasları biliniyorsa farklarının dağılımının normal olduğu kabul edilir. n 1 ve n 2 birimlik iki örneğin ortalamaların farkının standart sapması ( standart hata) şöyle yazılır: • Buna göre iki örnek ortalamasının farkı standart normal değişkene şöyle dönüştürülür. Deneysel Z değeri kritik Z değerinden ötede ise hipotez ret, aksi halde kabul edilir. 2 2 2 1 2 1 2 1 n n x x 2 2 2 1 2 1 2 1 2 1 ) ( ) ( n n X X Z

Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi

  • Upload
    cayla

  • View
    101

  • Download
    0

Embed Size (px)

DESCRIPTION

Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi. Normal dağılan iki kütle ortalamasının farkını test etmek için kütle varyanslarının bilinip bilinmemesine göre testler yapılır. 1) Kütle varyanslarının (  1 2 ve  2 2 ) bilinmesi durumu: - PowerPoint PPT Presentation

Citation preview

Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi

• Normal dağılan iki kütle ortalamasının farkını test etmek için kütle varyanslarının bilinip bilinmemesine göre testler yapılır.

• 1) Kütle varyanslarının (12 ve 2

2 ) bilinmesi durumu:• Normal dağılan iki kütlenin varyasları biliniyorsa farklarının

dağılımının normal olduğu kabul edilir. n1 ve n2 birimlik iki örneğin ortalamaların farkının standart sapması ( standart hata) şöyle yazılır:

• Buna göre iki örnek ortalamasının farkı standart normal değişkene şöyle dönüştürülür.

• Deneysel Z değeri kritik Z

değerinden ötede ise hipotezret, aksi halde kabul edilir.

2

22

1

21

21 nnxx

2

22

1

21

2121 )()(

nn

XXZ

Problem• A ve B marka pillerin ortalama ömürlerinin aynı olduğu standart

sapmalarının ise A marka için 50, B marka için 60 saat olduğu bildirilmiştir. Bu durumu araştırmak için A marka pillerden rastgele 40 pil alınmış ortalama ömrünün 300 saat, B marka pillerden 50 tanesi rastgele alınmış ortalama ömrünün 285 saat olduğu görülmüştür.

• a) Buna göre %1 anlam düzeyinde iki pilin ortalama ömürlerinin farklı olup olmadığını araştırınız.

• b) olma olasılığı ne olur?• Çözüm:• H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 )• H1 : µ1 - µ2 ≠ 0 ( veya µ1 ≠ µ2 )• Anlam düzeyi: = 0,01• Kritik değer ( Teorik dağılım değeri): Z/2 = Z0,01/2 = Z0,005= 2,58

15)( 21 XX

Problem - Çözüm• Deneysel Z değeri:

• Karar: Z0,005= 2,58 > Zdeneysel = 1,29 olduğundan H0 kabul edilir. Yani iki marka pilin ortalama ömürlerinin farklı olduğunu söylemek %1 anlam düzeyinde mümkün değildir.

• b) olma olasılığı:• P(Z > 1,29) olasılığı demektir.

29,16,11

15

503600

402500

0)285300(

)()(

2

22

1

21

2121

ZZ

nn

XXZ

]15)[( 21 XXP

29,1 0

29,1

0

0985,04015,05,0)()()()29,1( dzzfdzzfdzzfZP

Kütle varyansları (12 ve 2

2) bilinmiyor fakat eşit kabul edildiğinde iki kütle ortalamasının farkının testi

(Küçük örnek testi)• s1

2 ve s22, 1

2 ve 22 nin eğilimsiz tahmincileri olmak üzere

ortalamaların farkının varyansı:

• olup, örnek ortalamaları standart değişkene şöyle dönüştürülür.

• Değişkeninin dağılımı (n1+n2-2) serbestlik dereceli t dağılımına uyar. Deneysel t değeri ve kritik dağılım değeri karşılaştırılarak karar verilir.

2)1()1(

21

222

2112

nn

SnSnS p

21

2121

11)()(

nnS

XXt

p

Problem• Bir işletmede aynı parçayı üreten iki işçinin bu parçayı üretim

sürelerinin varyanslarının eşit olduğu bildirilmiştir. Bu işçilerin söz konusu parçayı üretim sürelerinin ortalamalarının eşit olup olmadığını araştırmak amacıyla 1. işçinin ürettiği 12 parça rastgele seçiliyor ortalamasının 20 dakika standart sapmasının 5 dakika olduğu görülüyor. 2. işçinin ürettiği parçalardan rastgele 15 tanesi gözlemleniyor ortalamasının 23 dakika, standart sapmasının 7 dakika olduğu görülüyor. Birinci işçinin üretim süresinin ikinciden düşük olup olmadığını %5 anlam düzeyinde test edip karar veriniz.

• Çözüm:• H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 )• H1 : µ1 - µ2 < 0 ( veya µ1 < µ2 )• Anlam düzeyi: = 0,05• Kritik dağılım değeri (teorik değer):• t0,05, 12-1+15-1 = t0,05,11+14 t0,05,25= -1,708

Problem - Çözüm

44,3825961

2151249)115(25)112(

2)1()1( 2

21

222

2112

pp S

nnSnSnS

• Olur. Böylece deneysel t değeri şöyle bulunur.

• Karar: t = -3,138 < t0,05,25= -1,708 olduğundan H0 hipotezi reddedilir.• İki işçinin üretim süreleri farklı olabilir.

138,395589,03

151

12147,2

0)2320(11

)()(

21

2121

tt

nnS

XXt

p

Kütle varyansları (12 ve 2

2) bilinmiyor ve eşit değilse iki kütle ortalamasının farkının testi (Küçük örnek testi)

• Eğer kütle varyansları bilinmiyor ve eşit değilse,

• t istatistiğinin dağılımı her iki kütlenin normal dağılması kaydıyla

v serbestlik dereceli t dağılımına uyar.

2

22

1

21

2121 )()(

nS

nS

XXt

11 2

2

2

22

1

2

1

21

2

2

22

1

21

nnS

nnS

nS

nS

v

Problem• Aynı çaplı iki farklı çekme halatının kopma kuvvetlerinin farklı olup

olmadığı araştırılıyor. Bu amaçla A marka halatlardan rastgele 10 örnek alınıp test edildiğinde kopma kuvvetlerinin ortalamasının 25 ton standart sapmasının 4 ton olduğu görülüyor. B marka halatlardan 14 örnek alınıp test edildiğinde ortalama kopma kuvvetinin 21 ton standart sapmasının 8 ton olduğu görülmüştür. Her iki kütlenin kopma kuvvetlerinin dağılımının normal olduğu kabul ediliyor. Bu verilere göre A marka halatların kopma kuvvetinin B den fazla olup olmadığını %5 anlam düzeyinde test ederek karar veriniz.

• Çözüm:• H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 )

• H1 : µ1 - µ2 > 0 ( veya µ1 > µ2 )• Anlam düzeyi: = 0,05

Problem - Çözüm• Serbestlik derecesi:

• Kritik dağılım değeri: t0,05,20 = 1,725• Deneysel t değeri:

• Karar: tdeneysel =1,62 < t0,05,20 = 1,72 olduğundan H0 hipotezi kabul edilir. A marka halatların kopma kuvveti B den farklı değildir.

2013,206,1284,0

08,38

1141464

1101016

1464

1016

11

22

2

2

2

2

22

1

2

1

21

2

2

22

1

21

vv

nnS

nnS

nS

nS

v

61,1

1464

1016

0)2125()()(

2

22

1

21

2121

t

nS

nS

XXt

Varyansı bilinmeyen kütlelerin ortalamalarının farkı için büyük örnek yaklaşımı

• Dağılımı normal olmayan iki kütlenin ortalamaları için örnekler küçük ise herhangi bir çözüm önerilememektedir. Bununla birlikte dağılımı ne olursa olsun eğer her iki kütleden çekilen örneklerin hacmi büyük ise ortalamaların farkının normale yaklaştığı kabul edilerek hipotezler test edilebilir. Böyle bir durumda test istatistiği

• Şeklinde olur. Kritik dağılım değeri normal dağılımdan elde edilerek bu test istatistiği ile karşılaştırılarak karar verilir.

2

22

1

21

2121 )()(

nS

nS

XXZ

Eşlenik örneklerde iki ortalamanın farkının testi• Buraya kadar incelediğimiz ortalamalarla ilgili testlerde örneklerin

bağımsız olduğu yani farklı kütlelerden geldiği kabul edilmişti. Bu konuda inceleyeceğimiz örnekler eşlenik yani bağımlı örnekler olacaktır. Burada birimler üzerinde farklı zamanlarda yapılan iki ölçüm çiftinin ortalamalarının farkı araştırılmaktadır.

• x1i : 1. ölçümde i. birimin değeri

• x2i : 2. ölçümde i. birimin değeri• i=1,2,3,……,n olup n: ölçüm çiftlerinin sayısıdır.• D= x1i - x2i , örnek çiftleri arasındaki farklar • : Farkların örneklem ortalaması=• SD : Di lerin standart sapması

nD

D iD

1)( 2

n

DDS iD

• nın standart hatası

• D’ lerin dağılımı normal kabul edilir. Bu durumda için test istatistiği şöyle yazılır.

• t test istatistiği n-1 serbestlik dereceli t dağılımı kritik değeri ile karşılaştırılarak hipotezin kabul veya reddine karar verilir.

:DS D

nSS D

D

D

DSDt

Eşlenik örneklerde iki ortalamanın farkının testi

Problem

Bir ilk öğretim okulunun 4. sınıf öğrencilerinin okuma hızlarının gelişimi üzerine yapılan bir araştırmada dönem başı ve sonunda olmak üzere eşlenik örnekleme yapılmış ve aşağıdaki veriler elde edilmiştir. Veriler okunan kelime sayılarıdır. Buna göre öğrencilerin okuma hızları dönem başına göre artış göstermiş midir? %5 anlam düzeyinde test edinip karar veriniz.

Dönem başı 60 75 80 65 66 72 87 90 75 82

Dönem sonu 75 77 82 70 65 80 85 95 80 90

Problem - Çözüm

• H0 : µ1 - µ2 = 0 ( veya µ1 = µ2 )

• H1 : µ1 - µ2 < 0 ( veya µ1 < µ2 )

• ∑Di = -47 olup Di lerin ortalaması ve standart sapması şöyle bulunur.

7,41047

DnD

D i

DDi 2)( DDi

Dönem başı 60 75 80 65 66 72 87 90 75 82Dönem sonu 75 77 82 70 65 80 85 95 80 90

Di -15 -2 -2 -5 1 -8 2 -5 -5 -8

-10,3 2,7 2,7 -0,3 5,7 -3,3 6,7 -0,3 -0,3 -3,3

106 7,29 7,3 0,09 32,5 10,9 44,9 0,09 0,09 10,9

94,41101,220

1)(2_

D

iD S

nDD

S

• D’lerin dağılımının standart hatası şöyle bulunur.

• Anlam düzeyi %5 olup kritik dağılım değeri:• t0,05,9 = -1,833• Deneysel test istatistiği şöyle bulunur:

56,11094,4

DD

D SnSS

94,256,17,4

tSDtD

Problem - Çözüm

• Karar: tdeneysel =-2,93 < t0,05,9 = -1,833 olduğundan H0 hipotezi reddedilir. Yani öğrencilerin okuma hızı dönem sonunda dönem başına göre artış göstermiştir.

Problem - Çözüm

İki oranın (Binom parametresi) farkının testi• n1 ve n2 birimlik örneklerin oranları sırası ile p1 ve p2 olmak üzere

örnek hacimleri yeterince büyük olduğu takdirde normal dağılıma yaklaşır. n1 hacimli örnekte uygun hal sayısı X1 ve n2 hacimli örnekte uygun hal sayısı X2 olmak üzere;

• Test edilecek H0 hipotezi:

• H0 : şeklinde oluşturulur.• nin her biri p parametresinin eğilimsiz tahmincileridir.

nin standart hatası şöyle yazılır.

• Z nin dağılımı normaldir.

olur.~~2

22

1

11 n

XpvenXp

ppp 21

21~~ pvep)~~( 21 pp

olup,~~~~

2

22

1

11_

2

_

1 nqp

nqp

PP

)1()()(

)(

21

_

2

_

1

_

2

_

1 pp

ppppZ

İki oranın (Binom parametresi) farkının testi

• p nin eğilimsiz tahmincileri olmakla birlikte (p1 = p2) hipotezi doğru ise p nin en iyi tahmincisi olarak

birleştirilmiş örneğin oranı kullanılır. Buna göre test istatistiği:

• şeklinde yazılabilir. Şu halde (p1 – p2= p) olursa 1. formül,

(p1 – p2= 0) ise 2. formül kullanılarak hipotezler test

edilir.

21~~ pvep

21

21~nnxxp

)2()11(~~

~~

21

21

nnqp

ppZ

Problem• Bir seramik fabrikasında lavabo üretimi için iki üretim

hattı mevcuttur. Hatların kusurlu oranlarının farklı olup olmadığı araştırılıyor. Bunun için yapılan araştırmada 1. hattan rastgele seçilen 140 lavabonun 8 tanesinin, 2. hattan çekilen 200 lavabonun 16 tanesinin kusurlu olduğu görülmüştür.

• a) Kusurlu oranlarının aynı olduğunu düşünerek• b) 2. hattın kusurlu oranının 1. den %1 daha fazla

olduğunu düşünerek hipotezleri %5 anlam düzeyinde test ediniz

Problem - Çözüm• a) H0 : p1 – p2 = 0

H1 : p1 – p2 < 0p1 = p2 kabul edildiğinden birleştirilmiş örnek varyansı kullanılarak

test yapılır. Birleştirilmiş örneğin oranı:

Test istatistiği:

Anlam düzeyi = 0,05 olupKritik dağılım değeri: Z0,05 = -1,65 olur.Karar: Zdeneysel=-0,82>Z0,05=-1,65 olduğundan

H0 kabul edilir. İki hattın kusurlu oranları farklı değildir.

olur.07,0200140168~

21

21

nnXXp

82,0028,0023,0

2001

1401)93,007,0(

20016

1408

)11(

~~

21

21

Z

nnpq

ppZdeneysel

Problem - Çözüm• b) H0 : p1 – p2 = -0,01

H1 : p1 – p2 < -0,01Standart hata

Test istatistiği

Anlam düzeyi = 0,05 olup Kritik dağılım değeri: Z0,05=-1,65Karar:Zdeneysel=-0,47> Z0,05=-1,65 olduğundan H0 kabul edilir.Yani ikinci hattın kusurlu oranları 1. hattın kusurlu oranından %1 daha

fazladır.

0274,0200

92,008,01400,9430,057

2

22

1

11_

2

_

1

n

qpnqp

PP

47,00274,0013,0

0274,0)01,0()08,0057,0()()(

21~~

21

_

2

_

1

ZppppZpp

Problem• Bir iş istasyonunda belli bir parçanın montajı yapılmaktadır.

Ustabaşı parçanın ortalama montaj süresinin 20 dakika olduğunu bildirmiştir. İşletmede çalışan endüstri mühendisi parçanın montajının daha uzun sürede gerçekleştirildiğini düşünmektedir. Parçanın montaj süresinin belirlenmesi için hattan rastgele seçilen 25 parçanın montaj süresi gözlemleniyor. Ortalama montaj süresi 22 dakika, standart sapması 4 dakika olarak bulunuyor. Elde edilen verilere göre;

• a) Hipotezleri oluşturunuz.• b) Hipotezi %1 anlam düzeyinde test ediniz.• c) %5 anlam düzeyinde hipotezin kabulü için 25 birimlik

örnekte ortalama montaj süresi en fazla ne kadar olmalıdır? Hesaplayınız.

• Parçanın montaj süresinin varyansının 5 dakika olduğu bilinmektedir. Ancak montaj süresinin ortalaması 20 dakikadan 22 dakikaya çıktığı taktirde %5 anlam düzeyinde bunun 25 birimlik bir örnekte fark edilememe olasılığı ne olur? (β hatası, yani yanlış hipotezin kabulü olasılığı ) Testin gücü ne olur?

Problemin devamı

• Aynı parçanın montajı için ikinci bir hattan 20 parça seçiliyor ve montaj süresi gözlemleniyor. Ortalama montaj süresi 23 dakika, standart sapması 6 dakika olarak hesaplanıyor. (Birinci hattan seçile 25 parçanın ortalama montaj süresi 20 dakika, standart sapması 5 dakika idi) Bu verilere göre

• İki hatta montajı yapılan parçaların ortalama montaj süresinin farklı olup olmadığını %5 anlam düzeyinde test ederek karar veriniz.

Problemin devamı

Problem• Bir işletmenin insan kaynakları departmanı personelin işe geç

kalma oranının %8 olduğunu bildirmiştir. İşletme yönetimi bu durumu araştırmak ve önlemler almak amacıyla bir çalışma başlatmıştır. Bunun için rastgele seçilen 120 personelden 15 tanesinin işe geç kaldığı görülmüştür. Bu verilere dayanarak işletmede işe geç kalma oranının %8 den fazla olup olmadığını %5 anlam düzeyinde araştırınız.

• Yine bu işletmede işe geç kalan personel oranının departmanlar arasında farklılık gösterip göstermediği araştırılıyor. Bunun için A departmanından 80 kişi rastgele seçilip gözlemleniyor bunların 10 tanesinin, B departmanından seçilen 60 kişiden 12 tanesinin işe geç kaldığı görülmüştür. Her iki departmandaki personelin işe geç kalma oranlarının farklı olup olmadığını %5 anlam düzeyinde test ederek karar veriniz.

Problem – devam-