Upload
phungdan
View
247
Download
4
Embed Size (px)
Citation preview
1
İSTATİSTİKSEL TAHMİNLEME VE
YORUMLAMA SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
DAĞILIMLARI
İSTATİSTİKSEL TAHMİNLEME VE
YORUMLAMA SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
DAĞILIMLARI
ÖRNEKLEME TEORİSİ VE
TAHMİN TEORİSİ
2
Yorumlama süreci
Populasyon
Örnek
Örnek
İstatistikleri
Tahminler
ve testler
),( spX
3
Örnek Tipleri
Örnek
Tipi
Olasılık Olasılık Dışı
Basit
Şans Tabakalı Sistematik Kümeli
Kitle Yargı Kota
4
Niçin Örnek?
Anakütle parametrelerinin örnek değerleri(örnek istatistikleri)
yardımıyla tahmin edilmesine imkan sağlamak modern
istatistiğin önemli bir görevidir.
Anakütlenin tamamı incelenmez.
Anakütleden bir şans örneği alınır.
Elde edilen örnek değerlerinin anakütle parametresi yerine
kullanılması için iki şart vardır:
a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe
girme şansı eşit olmalı
b. Örnek yeterince büyük olmalı
5
Örnekleme;
İadeli örnekleme:Çekilen birimin anakütleye tekrar iade
edilmesidir.
İadesiz örnekleme:Çekilen birim anakütleye iade edilmez.
Bir anakütleden alınan şans örneklerinin her birisi için örnek
istatistikleri hesaplandığında örnekleme dağılımları ortaya
çıkar:
Bir örneğin ortalaması hesaplanmışsa elde edilen iX
dağılımı ortalamaların örnekleme dağılımı,
Her örnek için p oranları hesaplandığında oranların örnek
dağılımı elde edilir.
6
İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla
ilgili örnekleme dağılımı ortaya çıkar:
Her iki anakütleden alınan nA ve nB büyüklüğündeki
örneklerin ortalamaları hesaplanmış ve bu ve AX BX
değerleri arasındaki farklar belirlenmişse elde edilen
dağılım ortalamalar arası farkların örnekleme
dağılımıdır.
Anakütlelerden alınan örnekler için oranlar hesaplanmış ve
bu oranların anakütleler itibariyle gösterdikleri farklılıklar
ortaya konulmuşsa elde edilen dağılım oranlar arası
farkların örnekleme dağılımıdır.
7
Bir populasyon parametresini tahminlemek için şans
değişkenleri kullanılır:
Örnek ortalaması, örnek oranı, örnek medyanı…
Örnek
hacmi
arttıkça
(n 30) ... Örnekleme
dağılışı normal
dağılıma
yaklaşır.
X
Merkezi Limit Teoremi
8
ORTALAMALARIN ÖRNEKLEME DAĞILIMI
Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi
bir tahmincisidir.
Her biri n hacimli çok sayıda örneğe ait ortalamaların
gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden
daha azdır.
Standart sapma bir örneğin değişkenliği hakkında bilgi
verirken ,
Ortalamaların örnekleme dağılımının değişkenliği standart
hatayla gösterilir.
9
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi,
ortalamaların örnekleme dağılımının değişkneliğini azaltıcı bir
faktördür.
Ana kütle standart sapması bilindiğinde standart hata
xx n
eşitliğiyle hesaplanır. Standart z değerleri
XZ
x
formulüyle hesaplanır. Ortalamaların örnekleme dağılımında
XX xx xx yerini alır.
10
XZ
x
xX
Z
x
Herhangi bir değerinin standart Z değerine dönüştürmesinde X
eşitliği kullanılır.
Z = 0
z = 1
Z
Örnekleme dağılımı Standart normal
dağılım
X
X
X
11
Normal populasyondan örnekleme
•Merkezi eğilim
•Yayılım
– yerine koyarak
örnekleme
Populasyon dağılımı
Örnekleme dağılımı
n =16 X = 2.5
n = 4 X = 5
= 10
X
nX
X
50X
50 X
12
Alıştırma
• Türk telekomda çalışan bir operatörsünüz.
Uzun mesafeli telefon görüşmeleri = 8
dk. & = 2 dk. İle normal dağılmakta.
Eğer 25 aramalık örnekler seçerseniz
örnek ortalamalarının % kaçı 7.8 & 8.2 dk.
arasında olacaktır?
13
Çözüm
Örnekleme
dağılımı
.3830
.1915 .1915
Standart normal
dağılım
Z X
n
Z X
n
7 8 8
2 25 50
8 2 8
2 25 50
. .
. .
8
X
= .4
7.8 8.2 0
Z = 1
-.50 Z .50 X
14
ORANLARIN ÖRNEKLEME DAĞILIMI
Oranların örnek dağılımının ortalaması anakütle oranına eşittir.
P
P 1 P
n
p PZ
P 1 P
n
ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir?
P
P 1 P 0.30 1 0.300.0458
n 100
15
ORANLARIN ÖRNEKLEME DAĞILIMI Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız.
1
1
p P 0.20 0.30Z 2.18
0.30(1 0.30)P 1 P
100n
2
2
p P 0.25 0.30Z 1.09
0.30(1 0.30)P 1 P
100n
P(0.20 P 0.25) P( 2.18 Z 1.09) 0.4854 0.3621
P(0.20 P 0.25) 0.1233
-2.18 -1.09
0.4854
0.3621 0.1233
16
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
2 2
1 2
X X
1 2n n
1 2 1 2
2 2
1 2
1 2
X XZ
n n
17
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,
1 2
2 2 2 2
1 2 1 2
X X
1 2 1 2
2 2
s s
n n n n
(0.04) (0.05) =
100 120
= 0.006
18
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
1 1 2 2
P P
1 2
P 1 P P 1 P
n n
1 2 1 2
1 1 2 2
1 2
p p P PZ
P 1 P P 1 P
n n
19
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
1 2
1 2
1 2
1 1 2 2
P P
1 2
P P
P P
P 1 P P 1 P
n n
0.08 0.92 0.05 0.95
100 150
0.0324
20
İstatistiksel metotlar
İstatistiksel
metotlar
Tanımlayıcı
istatistikler
Yorumlayıcı
istatistikler
Tahminleme Hipotez
Testi
21
Yorumlayıcı İstatistikler
• Aralık tahminleme
ve hipotez testlerini
içerir.
• Amacı populasyon
karakteristikleri
hakkında karar
vermektir.
Populasyon?
22
Tahmin süreci
Ortalama, ,
bilinmiyor
Populasyon Şans örneği %95 eminim ki,
, 40 ile 60
arasındadır.
Ortalama
= 50 X
23
Bilinmeyen populasyon
parametreleri tahminlenir...
Populasyon
parametresini
Örnek istatistiğiyle Tahminle!
Ortalama
Oran P p
Varyans s 2
Farklar 1 2 1 2
X
X X
2
24
Tahminleyicilerin Özellikleri
Sapmasız Sapmalı
B A X
)(XP
1. Sapmasızlık
N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.
E(X) E(X) 0
25
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Küçük örnek hacmi
Büyük örnek hacmi
A
B
)X(P
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir.
nlim P 1
,’nın tutarlı tahmincisidir.
26
Tahminleyicilerin Özellikleri
3. Etkinlik
A
B
X
)X(P
Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.
Etkin Tahminci
27
İstatistiksel Tahminleme
Nokta Tahmini Aralık Tahmini
Pp
σs
μ
X
.035P0.25
3.4σ2.5
60μ20
2
Populasyon parametresinin
tek bir tahmin değerini verir
Populasyon parametresinin
tahmin aralığını verir. Nokta
tahmini kullanılarak
hesaplanır.
28 28
Güven Aralığı Tahmininin Elemanları
Güven aralığı Örnek istatistiği
Alt güven sınırı Üst güven sınırı
Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı
Güven Aralığı Tahmini
Bir değer aralığı verir.
Populasyon parametresine yakınlık hakkında bilgi verir.
Olasılık terimleriyle ifade edilir.
29
Güven aralığı
Örneklerin 90%
Örneklerin 95%
Örneklerin 99%
x _
nZX
XZX
X
XXXX 58.2645.1645.158.2
XX 96.196.1
30
• Bilinmeyen populasyon parametresinin
aralık içine düşme olasılığıdır.
• %(1 - güven seviyesi
: Parametrenin aralık içinde olmaması
olasılığıdır.
• Tipik değerler %99, %95, %90
Güven Seviyesi
31
Aralıklar ve güven seviyesi
Ortalamanın
örnekleme
dağılımı
Çok sayıda aralık
aralık Aralıkların
%(1 - ) ‘ı
’yü kapsar.
% ‘sı
kapsamaz.
x
=
1 - /2 /2
X
_
x _
uzanirkadaraX
ZX
danX
ZX
'
'
32
Aralık genişliğini etkileyen
faktörler
• Verilerin yayılımı (
• Örnek hacmi X = X / n
• Güven seviyesi (1 - )
© 1984-1994 T/Maker Co.
Aralık
uzanir.ya'
dan'X
ZXX
ZX
33
Populasyon ortalamasının güven
aralığının hesaplanması
x
x
xx
ZX
ZHata
HataXZ
XyadaXHata
HataX
)5(
(4)
(3)
(2)
)1(
Parametre=
istatistik ±hata
34
Güven Aralığı Tahminleri
Ortalama
Güven Aralıkları
Oran
bilinmiyor biliniyor
Varyans
n<30 n30
t dağılımı Z dağılımı
35
Örneklerin 90%
Örneklerin 95%
Örneklerin 99%
x _
X
XXXX 58.2645.1645.158.2
XX 96.196.1
ORTALAMALAR İÇİN GÜVEN ARALIĞI
X X2 X 2P X z X z 1
n n
36
ORTALAMALAR İÇİN GÜVEN ARALIĞI
Örnek: Bir fabrikada üretilen 100 mamulün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen mamullerin ortalama ağırlığı %95 güvenle hangi aralıktadır?
Z = 0 z=1.96
/2=0.05/2=0.025
%95 için z değeri ± 1.96 0.475
z=-1.96
37
ORTALAMALAR İÇİN GÜVEN ARALIĞI
X X2 X 2P X z X z 1
n n
X
25 25P 1040 1.96 1040 1.96 0.95
100 100
XP 1035.1 1044.9 0.95
38
Örnek
•n = 25 hacimli bir şans örneğinin
ortalamasıX = 50 dir. Populasyonun
standart sapmasının X = 10 olduğu
bilindiğine göre X için 95% ‘lik güven
aralığını oluşturunuz.
92 . 53 08 . 46
25 10 96 . 1 50
25 10 96 . 1 50
x x
α/2 α/2P(X Z μ X Z ) 1 αn n
P( )=0.95
P( )=0.95
39
Populasyonun St.Sapması X Bilinmediğinde ve n 30
Olduğunda Ortalama İçin Güven Aralığı
• 1. Varsayımlar:
– POPULASYONUN standart sapması
bilinmiyor
– Populasyon Normal dağılımlıdır.
• 2. Merkezi limit teoremi kullanılarak Z Dağılımı
kullanılır.
• 3. Güven aralığı tahmini:
Örneğin st.sapması
x x
α/2 α/2
S SP(X Z μ X Z ) 1 α
n n
40
Populasyon st.sapması bilinmediğinde ve n30
olduğunda ortalama için güven aralığı örneği
•Bir ampul şirketi yeni bir ampul geliştirerek piyasaya
sürüyor. Üretim bandından 100 tanesi rassal olarak
seçiliyor ve bunların standart sapması 140 saat, kulanım
süreleri de ortalama olarak 1280 saat bulunuyor. =0.05
için populasyon ortalamasının güven aralığını bulunuz.
100
14096.11280
100
14096.11280
95.0)44.130756.1252(P
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla 1252.56 ile 1307.44 saat arasındadır.
P( )=0.95
41
Bir Oranın Güven Aralığı
• 1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyon Binom dağılımı gösterir.
• 2. Güven aralığı tahmini:
α1).SZpP.SZpP( pα/2pα/2
n
qpS p
ˆ.ˆˆ n
xp ˆ
Örnek
hacmi
Özellikli
birim sayısı
42
•400 lise öğrencisinden oluşan bir örnekte 32 öğrenci
üniversite sınavını kazanmıştır. Üniversite öğrencilerinin
sınavı kazanma oranı için %95’lik güven aralığını
bulunuz.
α1).SZpP.SZpP( pα/2pα/2
08.0400
32p
Bir Oranın Güven Aralığı
ÖRNEK:
0.08 1 0.08 0.08 1 0.08P 0.08 1.96 P 0.08 1.96 0.95
400 400
P 0.053 P 0.107 0.95
43
İki Ortalamanın Farkı İçin Güven Aralığı
Populasyon Varyansları Biliniyorsa:
1
nnZXX
nnZXXP
2
22
1
21
2/2121
2
22
1
21
2/21
α1n
S
n
SZXXμμ
n
S
n
SZXXP
2
22
1
21
α/2,2121
2
22
1
21
α/2,21
Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:
44
Populasyon st.sapması bilinmediğinde ve n>30
olduğunda iki ortalama farkı için güven aralığı
örneği
Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz.
1 1 1
2 2 2
X 86 S 12 n 40
X 72 S 14 n 35
45
Populasyon st.sapması bilinmediğinde ve n>30
olduğunda iki ortalama farkı için güven aralığı
örneği 1 1 1
2 2 2
X 86 S 12 n 40
X 72 S 14 n 35
α1n
S
n
SZXXμμ
n
S
n
SZXXP
2
22
1
21
α/2,2121
2
22
1
21
α/2,21
99.035
14
40
1258.22768μμ
35
14
40
1258.27268P
22
21
22
99.082.21μμ18.6P 21
46
İki Oran Farkının Güven Aralığı
• 1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyonlar Binom dağılımı gösterir.
• 2. Güven aralığı tahmini:
1SZppPPSZppPr2121 ppα/22121ppα/221
İki oran farkının
standart sapması 2
22
1
11ˆˆ
ˆ.ˆˆ.ˆ21 n
qp
n
qpS pp
47
İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup
olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet
hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B
ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği
gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının
farkının %95’lik güven aralığını bulunuz.
n1 = 1000, n2 = 1000 760,01000
760ˆ825,0
1000
825ˆ
21 pp
0.018
1000
)760.01.(760.0
1000
)825.01.(825.0
n
q.p
n
q.pS
2
22
1
11pp 21
48
İki Oran Farkının Güven Aralığına Örnek
95.0018.096.1760.082.0PP018.096.1760.082.0Pr 21
1SZppPPSZppPr2121 ppα/22121ppα/221
95.010.0PP029.0Pr 21
49
STANDART SAPMA İÇİN GÜVEN
ARALIĞI
Örnek standart sapması s,anakütle standart sapması ’nın
nokta tahminidir. Nokta tahmininden hareketle anakütle
standart sapmasının güven aralığı,
n
sZs
n
sZs
2222
/2 /2 1 -
n
sZs
22
n
sZs
22
2Z 2Z
s
50
Standart Sapmalar için Güven Aralığına Örnek
Bir makinada , bir hafta içersinde yapılan 200 bilyeli yatağın çapları ölçülmüş ve ortalama 2.09 cm , standart sapma ise 0.11 cm bulunmuştur. Bütün bilyeli yatakların çaplarına ait standart sapmanın güven sınırlarını bulunuz.
n=200
09.2X 11.0s 01.0
200.(2
11.058.211.0
)200.(2
11.058.211.0
1242.00958.0