Upload
others
View
18
Download
0
Embed Size (px)
Citation preview
BETİMLEYİCİ DURUM SAPTAYICI ARAŞTIRMALAR
MERKEZİ EĞİLİM OumlLCcedilUumlTLERİ
Herhangi bir değişken iccedilin toplanan bireysel verilerin genellikle belirli bir merkezinokta civarında değerler aldığı goumlzlemlenmektedir Merkezi eğilim oumllccediluumltleribirimlerin hangi değer etrafında toplandığını goumlsteren ve dolayısıyla ana kitleyitemsil eden (niteleyen) sayısal değerlerdir
Uygulamada en yaygın kullanılan merkezi eğilim oumllccediluumltleri ortalamalar (aritmetikortalama geometrik ortalama harmonik ortalama) ortanca (medyan) ve mod(tepe değer) olarak sayılabilirAritmetik Ortalama
Aritmetik ortalama bireylerin tamamının eşit ağırlığa sahip olduğunu varsayanbir merkezi eğilim oumllccediluumltuumlduumlr Yığın iccedilin aritmetik ortalama aşağıdaki formuumll ilehesaplanır
120583 =1198831 + 1198832 +⋯+ 119883119873
119873=σ119894=1119873 119883119894119873
Burada 120583 yığın iccedilin aritmetik ortalamayı 119873 ise yığındaki birim sayısını goumlstermektedir
Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir
ത119883 =1198831 + 1198832 +⋯+ 119883119899
119899=σ119894=1119899 119883119894119899
Burada 119899 oumlrnekteki birim sayısıdır
Aritmetik ortalamanın oumlzellikleri
Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir
Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir
Geometrik Ortalama
Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir
119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873
Geometrik ortalamanın oumlzellikleri
Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez
Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur
Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz
Harmonik Ortalama
Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir
119867119874 =119873
σ119894=1119873 1
119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır
119867119874 =3
1100
+180
+190
= 8926 kmsaat
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
MERKEZİ EĞİLİM OumlLCcedilUumlTLERİ
Herhangi bir değişken iccedilin toplanan bireysel verilerin genellikle belirli bir merkezinokta civarında değerler aldığı goumlzlemlenmektedir Merkezi eğilim oumllccediluumltleribirimlerin hangi değer etrafında toplandığını goumlsteren ve dolayısıyla ana kitleyitemsil eden (niteleyen) sayısal değerlerdir
Uygulamada en yaygın kullanılan merkezi eğilim oumllccediluumltleri ortalamalar (aritmetikortalama geometrik ortalama harmonik ortalama) ortanca (medyan) ve mod(tepe değer) olarak sayılabilirAritmetik Ortalama
Aritmetik ortalama bireylerin tamamının eşit ağırlığa sahip olduğunu varsayanbir merkezi eğilim oumllccediluumltuumlduumlr Yığın iccedilin aritmetik ortalama aşağıdaki formuumll ilehesaplanır
120583 =1198831 + 1198832 +⋯+ 119883119873
119873=σ119894=1119873 119883119894119873
Burada 120583 yığın iccedilin aritmetik ortalamayı 119873 ise yığındaki birim sayısını goumlstermektedir
Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir
ത119883 =1198831 + 1198832 +⋯+ 119883119899
119899=σ119894=1119899 119883119894119899
Burada 119899 oumlrnekteki birim sayısıdır
Aritmetik ortalamanın oumlzellikleri
Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir
Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir
Geometrik Ortalama
Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir
119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873
Geometrik ortalamanın oumlzellikleri
Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez
Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur
Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz
Harmonik Ortalama
Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir
119867119874 =119873
σ119894=1119873 1
119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır
119867119874 =3
1100
+180
+190
= 8926 kmsaat
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir
ത119883 =1198831 + 1198832 +⋯+ 119883119899
119899=σ119894=1119899 119883119894119899
Burada 119899 oumlrnekteki birim sayısıdır
Aritmetik ortalamanın oumlzellikleri
Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir
Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir
Geometrik Ortalama
Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir
119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873
Geometrik ortalamanın oumlzellikleri
Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez
Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur
Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz
Harmonik Ortalama
Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir
119867119874 =119873
σ119894=1119873 1
119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır
119867119874 =3
1100
+180
+190
= 8926 kmsaat
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Geometrik Ortalama
Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir
119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873
Geometrik ortalamanın oumlzellikleri
Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez
Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur
Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz
Harmonik Ortalama
Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir
119867119874 =119873
σ119894=1119873 1
119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır
119867119874 =3
1100
+180
+190
= 8926 kmsaat
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Harmonik Ortalama
Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir
119867119874 =119873
σ119894=1119873 1
119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır
119867119874 =3
1100
+180
+190
= 8926 kmsaat
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Harmonik ortalamanın oumlzellikleri
Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz
Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır
Ortanca (Medyan)
Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir
Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken
119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak
hesaplanır
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ortancanın oumlzellikleri
En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır
Tepe Değer (Mod)
En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz
Tepe değerin oumlzellikleri
Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr
Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez
Matematiksel işlemlere ortalama kadar uygun değildir
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ
Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Varyans ve Standart Sapma
Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir
1205902 =1
119873
119894=1
119873
119883119894 minus 120583 2
Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır
120590 =1
119873
119894=1
119873
119883119894 minus 120583 2
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir
1199042 =1
119899 minus 1
119894=1
119899
119883119894 minus ത119883 2
Burada
ത119883 Oumlrnek ortalamasını
1199042 Oumlrnek varyansını
119899 Oumlrnekteki birim sayısını goumlstermektedir
Değişim Katsayısı
Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ccedilarpıklık Katsayısı
Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır
DK =120590
120583
Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır
120572 =12058331205903
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ccedilarpıklık Katsayısı
120572 lt 0 ise dağılım sola ccedilarpıktır
120572 gt 0 ise dağılım sağa ccedilarpıktır
120572 = 0 ise dağılım simetriktir
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Basıklık Katsayısı
Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir
bull Basıklık Katsayısı
bull120574 lt 0 ise dağılım basıktır
bull120574 gt 0 ise dağılım sivridir
bull120574 = 0 ise dağılım normaldir
120574 =12058341205904
minus 3
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
SPSSrsquoTE VERİ GİRİŞİ
385 kişiye yapılan anket soruları aşağıdaki verilmiştir
Soru 1 Cinsiyetiniz
Erkek (1) Kadın (2)
Soru 2 Yaşınız helliphelliphelliphelliphellip
Soru 3 Mesleğiniz
Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)
İşccedili (4) İşsiz (5) Memur (6)
Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)
Tuumlccarİşadamı (8)
Soru 4 Eğitim Durumunuz
İlkoumlğretim (1) Lise (2) Uumlniversite (3)
Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Kesinlikle
Katılmıyorum
(1)
Katılmıyorum
(2)
Kararsızım
(3)Katılıyorum
(4)
Kesinlikle
Katılıyorum
(5)
L1Verilen Hizmetin
Kalitesi Yuumlksektir
L2Verilen hizmet iccedilin
bekleme suumlresi azdır
L3Ccedilalışan kişilerin
hizmet sunumu yuumlksektir
L4
İlgili personelin muumlşteri
şikacircyetlerini youmlnetme davranışı
iyidir
L5 İşyerlerine ulaşım kolaydır
L6Ccedilalışan personelin
muumlşteriye davranışı iyidir
L7Yuumlruumltuumllen işlemler başarıyla
tamamlanmaktadır
L8Verilen hizmetlerinin
ccedileşitliliği yeterlidir
L9Verilen hizmetler iccedilin
uygun fiyatlar alınmaktadır
L10Benzer hizmet sunan
birimlerden daha guumlvenlidir
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Verilerin frekans tablosunu merkezi eğilim ve dağılım
oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur
Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi
SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir
Mean= Aritmetik Ortalama
Median= Medyan
Mode= Mod (Tepe Değer)
Std Deviation= Standart Sapma
Variance=Varyans
Range=Accedilıklık
(Maksimum-Minimum)
Skewness=Ccedilarpıklık
Kurtosis=Basıklık
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ankete katılan 385 kişinin aylık
ortalama geliri 2009 TL Ortanca gelir
1672 TL standart sapma 1174 TL dir
Mod değerinin uumlzerinde tanımlanan
lsquoarsquo accedilıklaması birden fazla mod değeri
olduğunu goumlstermektedir
Ccedilarpıklık ve Basıklık oumllccediluumltleri
incelendiğinde aylık gelir değişkeni
Ccedilarpıklık=1062 ile sağa ccedilarpık bir
dağılıma Basıklık=0542 ile de sivri
bir dağılıma (varyansı kuumlccediluumlk) sahiptir
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir
Oumllccedilme Duumlzeyi Oumllccediluumlt
Sınıflama (Nominal) Mod
Sıralama (Ordinal) Mod Medyan
Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım
oumllccediluumltleri kullanılırOranlama (Ratio)
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Aylık toplam gelir değişkenin dağılımını Histogramına bakarak
goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences
rarr Charts kısmına girilerek Histogram ccedilizdirilir
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
EXPLORE MENUumlSUuml
Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici
istatistiklerini hesaplar
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Dependent variable kısmına nicel bir değişken ve factor list
kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş
nitel bir değişken atılır
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı
aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer
almaktadır
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)
Mod ve medyan aykırı (uccedil) değerlerden etkilenmez
Aritmetik ortalama birimlerin tamamını kullanmaz
Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr
Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır
Standart sapmanın birimi yoktur (birimden bağımsızdır)
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez
A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan
S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir
A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812
S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur
A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri
C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal
S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır
A) Aritmetik B) Geometrik C) Harmonik D) Medyan
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
NİCEL VERİ ANALİZİ
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
HİPOTEZ TESTLERİ
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir
Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir
Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir
Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır
Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır
Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır
Karar
1198670 Red Edildi 1198670 Red Edilemedi
1198670 Gerccedilekte
Doğru Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
YanlışDoğru Karar
(Testin Guumlcuuml=1 minus 120573)Yanlış Karar
(II Tip Hata=120573)
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Karar
1198670 Red Edildi
(Succedillu)
1198670 Red Edilemedi
(Masum)
1198670
Masum
(Doğru)
Yanlış Karar
(I Tip Hata=120572)Doğru Karar
(Guumlven Duumlzeyi=1 minus 120572)
Succedillu
(Yanlış)
Doğru Karar
(Testin Guumlcuuml=1 minus 120573)
Yanlış Karar
(II Tip Hata=120573)
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
βyı Etkileyen Faktoumlrler
Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar
Anlamlılık duumlzeyi 120572 azalırken 120573 artar
Yığın standart sapması 120590 arttıkccedila 120573 artar
Oumlrnek hacmi 119899 azaldıkccedila 120573 artar
Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir
Hipotezlerin kurulması
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi
Test istatistiğinin hesaplanması
Karar
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Hipotezlerin Kurulması
Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır
Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır
1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir
Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur
1198670 120583 = 2000
1198671 120583 gt 2000
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi
İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Test İstatistiğinin Hesaplanması
Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır
Karar Kuralı
İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir
Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
COMPARE MEANS MENUumlSUuml
Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Means Menuumlsuuml
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız
değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve
erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici
istatistikler elde edilir
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır
Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar
eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı
elde edilir
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )
Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır
1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830
Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama
ത119883 =σ119894=1119899 119883119894119899
olacaktır
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur
1198670 120583 = 22001198671 120583 ne 2200
Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır
119905 =ത119883 minus 120583
ൗ119878 119899
SPSSrsquode bu hipotezleri test edelim
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
One Sample T-Test penceresinde Test Variable(s) kısmına Aylık
Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra
OKrsquoe basılır
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı
olduğu durumda geccedilerli olan olasılık değeridir
1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-
değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)
Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901
2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak
uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0
1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Durum Test İstatistiği Serbestlik Derecesi
12059012 ve 1205902
2
bilinmiyor
12059012 = 1205902
2
119905ℎ =ത1198831 minus ത1198832
1199041199012 11198991
+11198992
1199041199012
=11990412 1198991 minus 1 + 1199042
2 1198992 minus 1
1198991 + 1198992 minus 2
1198991 + 1198992 minus 2
12059012 ve 1205902
2
bilinmiyors
a
12059012 ne 1205902
2
119905ℎ =ത1198831 minus ത1198832
11990412
1198991+11990422
1198992
11990412
1198991+11990422
119899211990414
11989912 1198991 minus 1
+11990424
11989922 1198992 minus 1
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler
1198670 12059012 = 1205902
2
1198671 12059012 ne 1205902
2
1198670 hipotezi altında test istatistiği
119865ℎ =11990412
11990422
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir
1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0
1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0
Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yandaki tabloda 1198670 12059012 =
12059022 hipotezinin testine ait
sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir
119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670
hipotezi reddedilememektedir
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır
119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml
Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır
Bunlar
1 İşlem oumlncesi-işlem sonrası tasarımı
2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı
İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X
değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi
tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de
kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı
sorusuna cevap aranmaktadır
Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş
verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili
eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş
olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu
test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır
bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve
ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri
bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t
değişkenidir
119905ℎ =ҧ119889
Τ119878119889 119899~119905119899minus1
Burada
ҧ119889 =σ 119889119894
119899ve 119878119889 =
1
119899minus1σ119894=1119899 119889119894 minus ҧ119889
2
Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır
Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir
şeklindedir
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan
memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin
puanlanmasından elde edilen verilerin ortalaması alınarak her
birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma
2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel
memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan
ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre
artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz
119889119894 = 1199092013119894 minus 1199092014119894
olmak uumlzere hipotezler
1198670 120583119889 = 01198671 120583119889 lt 0
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır
Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert
sorusunun ortalaması alınmıştır
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe
memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni
atanır
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan
119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif
olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894
2= 0000 lt 005 olduğundan
1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A
kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014
yılında arttığını goumlstermektedir
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının
karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin
2rsquoden fazla gruba genişletilmiş halidir
Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine
ihtiyaccedil duyulmaktadır
2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin
kullanılması 1 tip hatanın artmasına yol accedilmaktadır
Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli
karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3
2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip
hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak
uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı
095 times 095 times 095 times 095 times 095 times 095 = 0735
olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır
Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir
Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur
Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1 2
1 2
11 12 1
21 22 2
31 32 3
1 2 k
k
k
k
k
n n n k
G G G
x x x
x x x
x x x
x x x
119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903
ҧ119909119895 119895 gruptaki birimlerin ortalamas120484
119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484
ҧ119909 Genel ortalama
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
ANOVA Tablosu
Değişimin
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler Ortalaması
F
Gruplar
Arasık-1 GAKT
GAKO=
GAKT(k-1)GAKOGIKO
Gruplar
İccedilin-k GIKT
GIKO=
GIKT(n-k)
Toplam n-1 TKT
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir
1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896
ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın
ortalamalarına goumlre farklılık goumlstermektedir
Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır
İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir
1198670 12059012 = 1205902
2 = 12059032
1198671 1205901198942 ne 120590119895
2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899
119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670
hipotezi reddedilir
Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1198670 1205831 = 1205832 = 12058331198671 120583119895
prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895
= 123
Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
DOĞRU-YANLIŞ SORULARIDoğru Yanlış
Birinci ve ikinci tip hata arasında ilişki yoktur
Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir
Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir
Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar
İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır
Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
S-2) I tip hata aşağıdakilerden hangisine karşılık gelir
A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı
B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı
C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı
D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı
S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur
A) İlişki yoktur B) İlişki aynı youmlndedir
C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir
S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır
A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi
C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
KORELASYON ANALİZİ
Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır
120588119883119884 =119862119900119907 119883 119884
120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı
OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-
029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır
Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır
SPSSrsquote Korelasyon Analizi
Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)
Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
DOĞRUSAL REGRESYON ANALİZİ
Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır
119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894
Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur
Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir
119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =
120597119884
120597119883119895= 120572119895
O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir
İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması
Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir
Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır
Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0
Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur
Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir
Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir
119879119870119879 =
119894=1
119899
119884119894 minus ത119884 2
119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)
1198772 =119877119870119879
119879119870119879= 1 minus
119860119870119879
119879119870119879şeklinde hesaplanır Burada
119877119870119879 =
119894=1
119899
119884119894 minus ത1198842
119860119870119879 =
119894=1
119899
119884119894 minus 1198841198942
Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır
SPSSrsquote Doğrusal Regresyon Analizi
Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz
119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894
ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942
ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır
1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir
değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede
yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895
prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12
F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
DOĞRU-YANLIŞ SORULARIDoğru Yanlı
ş
Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile
X arasındaki korelasyonu hesaplamak sonucu değiştirmez
Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml
hakkında bilgi vericidir
Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında
bilgi verebilir
Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml
azalır
Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler
hata teriminin oumlnemli bir kaynağıdır
Regresyon analizinde hata terimi deterministik bir bileşendir
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri
tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki
marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur
A) Diğer her şey sabitken X 1 arttığında Y 06 artar
B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar
C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar
D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar
S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan
Pearson korelasyon katsayısının birimidir
A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin
birimi
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır
A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml
C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak
4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak
hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır
A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde
kuvvetli bir ilişki vardır
C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında
aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
SPSSrsquoTE CcedilAPRAZ TABLO
Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi
Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)
Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)
Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin
Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin
Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır
Analyze rarr Descriptive Statistics rarr Crosstabshellip
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Kİ-KARE BAĞIMSIZLIK TESTİ
Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda
119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)
119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı
119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı
Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1198670Değişkenler bağımsızdır
1198671Değişkenler bağımsız değildir
1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895
119861119894119895 =119899119894 times 119899119895
119899şeklinde hesaplanır
1198670 hipotezi doğru iken test istatistiği
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895
2
119861119894119895
Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ
2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir
120594ℎ2 gt 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilebilir
120594ℎ2 le 120594119879119886119887119897119900
2 ise 1198670 hipotezi reddedilemez
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar
(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır
(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir
Bu koşullar sağlanmadığında
Oumlrnek ccedilapı arttırılabilir
Satırlar veya suumltunlar birleştirilebilir
(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır
120594ℎ2 =
119894=1
119888
119895=1
119903119866119894119895 minus 119861119894119895 minus 05
2
119861119894119895
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur
1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır
Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine
bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile
gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır
1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity
Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ
2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir
Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
DOĞRU-YANLIŞ SORULARI
Doğru Yanlış
Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir
Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir
Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz
Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır
Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır
Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20
TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki
tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır
Aşağıdakilerden hangisi sıfır (1198670) hipotezidir
A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar
B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır
C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur
D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir
S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz
A) 5 B) 10 C) 15 D) 20